МЕТОД ВИЯВЛЕННЯ ПЕРСПЕКТИВНИХ НАУКОВИХ ТЕМ НА ОСНОВІ ГІБРИДНИХ TRANSFORMER-АРХІТЕКТУР ЗА ДАНИМИ НАУКОМЕТРИЧНИХ БАЗ
Анотація
У статті вирішено актуальне науково-прикладне завдання автоматизації виявлення перспективних наукових напрямів у великих масивах наукометричних даних. Стрімке зростання кількості публікацій створює інформаційне перевантаження, що ускладнює роботу дослідників із пошуку латентних трендів. Запропоновано універсальний метод, що базується на гібридній архітектурі глибокого навчання, яка поєднує переваги згорткових нейронних мереж (CNN) та Transformer – архітектур. Особливістю методу є використання CNN-шару як екстрактора локальних термінологічних паттернів, що дозволяє виявляти стійкі ключові фрази в анотаціях статей. Наступний каскад Transformer-шарів із механізмом MultiHeadAttention забезпечує моделювання глобальних семантичних зв’язків, що критично важливо для аналізу вузькоспеціалізованих текстів. Для подолання проблеми дисбалансу класів у наукометричних вибірках застосовано функцію втрат Focal Loss, що дозволило моделі ефективніше фокусуватися на рідкісних, але потенційно «проривних» темах.Апробацію методу проведено на базі метаданих Scopus у галузі кібербезпеки Інтернету речей (IoT Security), що охоплює 4833 публікації. Результати експериментальних досліджень продемонстрували високу ефективність моделі: досягнуто показник повноти (Recall) на рівні 0.80 та F1-score 0.61, що перевищує результати класичних моделей LSTM. Такий розподіл метрик є методологічно обґрунтованим для задач наукового пошуку, де пріоритетом є мінімізація ризику пропуску нових перспективних тем. Додатково реалізовано прогнозний модуль на основі лінійної регресії часових рядів цитувань, що дозволяє оцінювати майбутній потенціал напрямів. Запропоноване рішення є універсальним і може бути застосоване для підтримки прийняття рішень при плануванні досліджень та підготовці грантових заявок у різних наукових доменах
Посилання
2. Efficient estimation of word representations in vector space / Mikolov T., Chen K., Corrado G., Dean J. 2013. arXiv:1301.3781 [cs.CL]. URL: https://arxiv.org/abs/1301.3781 (дата звернення: 14.01.2026).
3. Devlin J. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. 2018. 16 с. (Препринт. 10.48550/arXiv.1810.04805). URL: https://arxiv.org/pdf/1810.04805 (дата звернення: 14.01.2026).
4. Kim Y. Convolutional Neural Networks for Sentence Classification. Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP) (Doha, Qatar, 25–29 Oct. 2014). Doha: Association for Computational Linguistics, 2014. P. 1746–1751.
5. Research on a hybrid LSTM-CNN-Attention model for textbased web content classification. Radio Electronics, Computer Science, Control. 2025. № 4. URL: https://ric.zp.edu.ua/article/view/346199. (дата звернення: 14.01.2026)
6. A Fine-Tuned BERT-Based Transfer Learning Approach for Text Classification / R. Qasim et al. Journal of Healthcare Engineering. 2022. Vol. 2022. P. 1–17. DOI: https://doi.org/10.1155/2022/3498123
7. Simha A. Understanding TF-IDF for machine learning. Capital One Tech. URL: https://medium.com/capitalone-tech/understanding-tf-idf-for-machine-learning-capital-one-dea9ab4a586d (дата звернення: 14.01.2026).
8. Feldges C. LSTM, BERT: a comparison of performance. https://medium.com/. URL: https://medium. com/@claude.feldges/text-classification-with-tf-idf-lstm-bert-a-quantitative-comparison-b8409b556cb3 (дата звернення: 14.01.2026).
9. Evaluating text classification: A benchmark study / M. Reusens et al. Expert Systems with Applications. 2024. P. 124302. DOI: https://doi.org/10.1016/j.eswa.2024.124302.
10. Generative AI and the future of scientometrics: current topics and future questions / Eger S., Bornmann L., van Eck N. J. 2025. arXiv:2507.00783 [cs.DL]. URL: https://arxiv.org/pdf/2507.00783 (дата звернення: 14.01.2026).

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
ISSN 


