АЛГОРИТМ КЛАСИФІКАЦІЇ МЕДИЧНИХ ДАНИХ ДЛЯ ПРОГНОЗУВАННЯ ОНКОЛОГІЇ
Анотація
У даній роботі наведено результати досліджень застосування Логістичної регресії та Дерева рішень з використання алгоритму PCA в задачі виявлення та прогнозуванні онкології. Було проаналізовано проблему та актуальність даного дослідження. Проаналізовано різноманітні літературні джерела та методи машинного навчання. Проведений детальний аналіз обраних методів, а також розглянути їх математичні моделі. Було проведено тренування відповідних моделей та ряд експериментів для обрання найкращих параметрів на обраних двох наборах даних, які були детально проаналізовані в даній роботі. Наведено результати точності моделей та побудовані відповідні метрики, такі як Classification report, Confusion Matrix, Roc-curve. Також були проведені експерименти для покращення точності моделей з використання алгоритму PCA. В результаті були отримані набагато кращі результати у випадку з другим набором даних, але з першим покращити точність не вдалося. Після проведення експериментальної частини було детально проаналізовано отримані результати та наведені відповідні гістограми для кожного з наборів даних з отриманими результатами. Дане дослідження доводить, що алгоритм PCA краще використовувати, тоді коли наявний набір даних з великою кількістю ознак. В результаті дослідження були отримані хороші результати у задачі виявлення та прогнозування онкології та наведено цінність даного дослідження з описаними висновками. В роботі проводиться оцінка результатів за допомогою різних метрик, таких як точність та чутливість, і результати порівнюються з іншими методами аналізу та класифікації. Доведено, що ці методи можуть вдосконалити процес діагностики онкології, сприяти зменшенню помилкових класифікацій та сприяти ранньому виявленню хвороби.
Посилання
2. Jenni A.M., Sidey-Gibbons C.J. Machine learning in medicine: a practical introduction. BMC Medical Research Methodology. 2019. Vol. 19. No. 64. https://doi.org/10.1186/s12874-019-0681-4
3. Kourou K., Exarchos T.P., Exarchos K.P. Machine learning applications in cancer prognosis and prediction. Computational and Structural Biotechnology Journal. 2015. Vol. 13. 8-17. https://doi.org/10.1016/j.csbj.2014.11.005
4. Li Y., Hu G., Liu L., Xie Y., Xu Z. A performance analysis of dimensionality reduction algorithms in machine learning models for cancer prediction. Data in Brief. 2021. Vol. 37. 100125. https://doi.org/10.1016/j.health.2022.100125
5. Sayed S. Machine Learning Is The Future Of Cancer Prediction. Towards Data Science. 2018. URL: https://towardsdatascience.com/machine-learning-is-the-future-of-cancer-prediction-e4d28e7e6dfa.
6. Azar A.S., Rikan S.B., Naemi A. Application of machine learning techniques for predicting survival in ovarian cancer. BMC Medical Informatics and Decision Making. 2022. Vol. 22. No. 68. https://doi.org/10.1186/s12911-022-02087-y
7. Jaber N. Can Artificial Intelligence Help See Cancer in New, and Better, Ways? National Cancer Institute. 2022. URL: https://www.cancer.gov/news-events/cancer-currents-blog/2022/artificial-intelligence-cancer-imaging.
8. Mudawi N.A., Alazeb A. A Model for Predicting Cervical Cancer Using Machine Learning Algorithms. Sensors (Basel). 2022. Vol. 22(11). 4132. https://doi.org/10.3390/s22114132
9. Kourou K., Exarchos T.P., Exarchos K.P. Machine learning applications in cancer prognosis and prediction. Computational and Structural Biotechnology Journal. 2015. Vol. 13. 8-17. https://doi.org/10.1016/j.csbj.2014.11.005
10. Yan-yan Y., Lu Y. Decision tree methods: applications for classification and prediction. Shanghai Archives of Psychiatry. 2015. Vol. 27. No. 2. 130-135. https://doi.org/10.11919/j.issn.1002-0829.215027.