ІНТЕЛЕКТУАЛЬНЕ БАЛАНСУВАННЯ НАВАНТАЖЕННЯ В МІКРОСЕРВІСНІЙ АРХІТЕКТУРІ

Ключові слова: прогнозування навантаження, міскросервіс, архітектура, хмарні обчислення, розподілена система, хмарні сервіси, машинне навчання, штучний інтелект

Анотація

У статті запропоновано інтелектуальний метод балансування навантаження в мікросервісних архітектурах, що поєднує паралельну маршрутизацію запитів (hedging) із багаторуким бандитом на основі вибірки Томпсона (Thompson Sampling MAB). Мета підходу – подолати «хвостові» затримки (tail latency) та змінність продуктивності, які не усуваються традиційними політиками (Round Robin, Least Connections) за неоднорідних і вибухових навантажень. Архітектура складається зі шлюзу API на базі YARP, що виконує зважене дублювання запитів, AI-балансувальника (FastAPI), який навчає ймовірності маршрутизації за поточною телеметрією, та моніторингового стеку Prometheus–Grafana, що забезпечує безперервний зворотний зв’язок для адаптації. Спостережувані метрики (перцентилі затримки, частка помилок) перетворюються на «нагороду», якою оновлюються апостеріорні розподіли для кожної репліки за Thompson Sampling, завдяки чому система збалансовує «дослідження ↔ експлуатацію» та уникає фіксації на тимчасово швидких, але нестабільних вузлах. Проведено оцінювання чотирьох стратегій: статичний round-robin (k=1), статичний hedging (k=2), адаптивний hedging з MAB (k=2) та адаптивний hedging з MAB (k=3). За умов до 1000 паралельних клієнтів адаптивний hedging з Thompson Sampling зменшив P99 приблизно на 65% і частку помилок – на ≈45% порівняно з базовим варіантом, не знижуючи пропускну здатність і лише помірно підвищуючи використання CPU. Збільшення k понад 2 дає мінімальний додатковий ефект, що підтверджує доцільність «малого k» за наявності ймовірнісних ваг і гарантій ідемпотентності. Результати демонструють, що поєднання спекулятивного дублювання та баєсівського прийняття рішень є легким і хмароорієнтованим шляхом до стійкої до «хвостів» продуктивності. Рішення є модульним і відтворюваним, придатним до розгортання в Kubernetes, а також до IoT/кіберфізичних сценаріїв, де потрібні адаптивна координація та висока надійність у реальному часі.

Посилання

1. Linkerd. Beyond Round-Robin: Load Balancing for Latency. URL: https://linkerd.io/2016/03/16/beyond-round-robin-load-balancing-for-latency (дата звернення: 06.09.2025).
2. Wang H., Wang Y., Liang G., Gao Y., Gao W., Zhang W. Research on load balancing technology for microservice architecture. MATEC Web of Conferences. 2021. Vol. 336. P. 08002. EDP Sciences.
3. Cui J., Chen P., Yu G. A learning-based dynamic load balancing approach for microservice systems in multi-cloud environment. 2020 IEEE 26th International Conference on Parallel and Distributed Systems (ICPADS). 2020. P. 334–341. IEEE.
4. Dean J., Barroso L. A. The tail at scale. Communications of the ACM. 2013. Vol. 56, No. 2. P. 74–80.
5. Zhang P., Xiang L., Song Z., Yang Y. Adaptive load balancing and fault-tolerant microservices architecture for high-availability web systems using Docker and Spring Cloud. Discover Applied Sciences. 2025. Vol. 7, Article 705. DOI: 10.1007/s42452-025-07320-7.
6. Moritz de Carvalho Neto P., Castro M., Siqueira F. Dynamic load balancing in Kubernetes environments with Kubernetes Scheduling Extension (KSE). Concurrency and Computation: Practice and Experience. 2024. Vol. 37, No. 3. e8344. DOI: 10.1002/cpe.8344.
7. Bhattacharya R., Gao Y., Wood T. Dynamically balancing load with overload control for microservices. ACM Transactions on Autonomous and Adaptive Systems. 2024. Vol. 19, No. 4. Article 22. DOI: 10.1145/3676167.
8. Singh N., Hamid Y., Juneja S. та ін. Load balancing and service discovery using Docker Swarm for microservice based big data applications. Journal of Cloud Computing. 2023. Vol. 12, No. 1. Article 4. DOI: 10.1186/s13677-022-00358-7.
9. Selvakumar G., Jayashree L. S., Arumugam S. Latency minimization using an adaptive load balancing technique in microservices applications. Computer Systems Science & Engineering. 2023. Vol. 46, No. 1. P. 1215–1231. DOI: 10.32604/csse.2023.021879.
10. Аксак Н., Кушнарьов М., Шеліхов Ю. Інтелектуальні системи керування мікрокліматом у розумних середовищах. Information control systems and intelligent technologies. Achievements and applications: монографія / за ред. проф. В. Вичужаніна. Львів–Торунь: Liha-Pres, 2025. С. [273–295]. 402 с. ISBN 978-966-397-538-2. DOI: https://doi.org/10.36059/978-966-397-538-2
Опубліковано
2025-12-30
Як цитувати
Аксак, Н. Г., & Шеліхов, Ю. О. (2025). ІНТЕЛЕКТУАЛЬНЕ БАЛАНСУВАННЯ НАВАНТАЖЕННЯ В МІКРОСЕРВІСНІЙ АРХІТЕКТУРІ. Системи та технології, 70(2), 210-218. https://doi.org/10.32782/2521-6643-2025-2-70.23
Розділ
КОМП’ЮТЕРНА ІНЖЕНЕРІЯ