Публикации автора

ПРИМЕНЕНИЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОПРЕДЕЛЕНИЯ ГРУПП РИСКА ХРОНИЧЕСКИХ ЗАБОЛЕВАНИЙ СРЕДИ ПАЦИЕНТОВ (2025)

Хронические неинфекционные заболевания являются важной медико-социальной проблемой, оказывающей существенное влияние на структуру заболеваемости и смертности населения. Актуальность исследования обусловлена необходимостью повышения точности диагностики, персонализации подходов к профилактике и снижению нагрузки на систему здравоохранения. Цель работы - оценка возможности применения современных методов машинного обучения для прогнозирования вероятности развития повышенного артериального давления у взрослых пациентов, наблюдающихся в условиях поликлинического звена. В работе проанализированы обезличенные карты 1843 пациентов. После предварительной обработки, включающей очистку и нормализацию данных, были исследованы следующие алгоритмы: Random Forest, Gradient Boosting, XGBoost, метод K-ближайших соседей и рекуррентная нейронная сеть LSTM. Для верификации качества построенных моделей применялись метрики точности, полноты, F1-мера и ROC-AUC. Результаты апробации показали, что Gradient Boosting и рекуррентная нейронная сеть LSTM наиболее успешно справились с задачей стратификации выборки: пациенты были корректно распределены на группы с отсутствием заболевания, наличием артериальной гипертензии и повышенным риском ее развития. Были показаны ключевые факторы риска - гиперхолестеринемия, неправильное питание и избыток массы тела. Полученные результаты подтверждают целесообразность и перспективность внедрения инструментов машинного обучения, в частности градиентного бустинга и нейросетевых моделей, в клинические информационные системы с целью автоматизированного скрининга артериальной гипертензии и последующего планирования профилактических мероприятий.

Издание: СОВРЕМЕННЫЕ НАУКОЕМКИЕ ТЕХНОЛОГИИ
Выпуск: № 6 (2025)
Автор(ы): Королева Я. А., Родионов Алексей Владимирович
Сохранить в закладках
ОЦЕНКА КОЛЕБАНИЙ ЧИСЛЕННОСТИ БАКТЕРИОПЛАНКТОНА ПО ВЕРТИКАЛИ ВОДНОЙ ТОЛЩИ ОЗЕРА БАЙКАЛ ЗА МНОГОЛЕТНИЙ ПЕРИОД (2024)

В статье предлагаются два подхода к анализу временных рядов численности бактериопланктона в трех различных слоях водной толщи озера Байкал. При первом подходе рассчитываются значения сезонной компоненты рядов методом скользящей средней и строятся аддитивные и мультипликативные модели, из которых на основании рассчитанных коэффициентов достоверности, выбираются лучшие. Проводится интерпретация оценок значений сезонной компоненты в каждой из них. При втором подходе выполняется корреляционно-регрессионный анализ совместного изменения численности бактериопланктона, температуры и уровня воды озера. Выдвигаются и проверяются статистические гипотезы о значимости коэффициентов корреляции между рассматриваемыми факторами. Строится математическая модель множественной регрессии с включением фиктивных переменных, описывающих влияние сезонных колебаний на изменение численности бактериопланктона. Рассчитывается статистическая оценка значимости построенной модели и включенных в модель факторов. Приводится интерпретация результатов корреляционно-регрессионного анализа по отношению к исследуемой предметной области. Делается вывод о том, что полученные результаты могут быть использованы при прогнозировании количества бактериопланктона в разные периоды времени, при составлении экологического обоснования состояния озера, а также прогноза его микробиологического режима.

Издание: МОДЕЛИРОВАНИЕ, ОПТИМИЗАЦИЯ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
Выпуск: Т. 12 № 1 (2024)
Автор(ы): Бурдуковская Анна Валерьевна, Белых Татьяна Ивановна, Родионов Алексей Владимирович
Сохранить в закладках
Исследование влияния параметров алгоритма k-ближайших соседей на метрики качества моделей (2024)

В данной статье было проведено исследование влияния параметра k, размера обучающей выборки и ряда популярных метрик расстояний для метода k-ближайших соседей (kNN - k-nearest neighbors) на качество моделей с использованием метрик RMSE и R2. Алгоритм K-ближайших соседей является одним из самых популярных среди ML-моделей для решения задач классификации и регрессии. Тщательная настройка параметров - фундаментальный аспект для достижения баланса между точностью и эффективностью модели. Важность правильного выбора параметров k и метрики расстояния является ключевым фактором для создания модели с высокой точностью. В результате исследования были получены оптимальные значения параметра k алгоритма, которые применимы для решения большинства прикладных задач. Наиболее часто используемые метрики, такие как Евклидова и Манхэттенская, показали сопоставимую эффективность по сравнению с метриками Чебышева и Махаланобиса. Практическая применимость оптимальных характеристик алгоритма делает его решения востребованными в разнообразных прикладных задачах классификации и регрессии.

Издание: SYSTEM ANALYSIS AND MATHEMATICAL MODELING
Выпуск: Т. 6, № 2 (2024)
Автор(ы): Родионов Алексей Владимирович, Ищенко К. Л.
Сохранить в закладках