Применение методов машинного обучения для оценки факторов, влияющих на выживаемость при раке молочной железы

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: ИТ. Наука. Креатив; Омск; Омск

Год издания: 2025

Ключевые слова: цензурирование данные, выживаемость, регрессия Кокса, рак молочной железы, censoring data, survival, Cox regression, breast cancer

Аннотация: На основе реальных данных о 23280 пациентах с раком молочной железы, полученных из КГБУЗ «Красноярский краевой клинический онкологический диспансер им. А.И. Крыжановского» за период 2014-2024 гг., создан прототип модели прогнозирования общей выживаемости. В рамках разработки использованы регрессионные модели машинного обучения: слуПоказать полностьючайный лес (R2=0,80) и градиентный бустинг (R2=0,73), а также регрессия на основе взаимной информации. Наиболее значимые признаки, выделенные в этих моделях, послужили основой для построения модели Кокса (C-индекс 0,75). Определены ключевые прогностические факторы, влияющие на общую выживаемость: классификация TNM, количество курсов химиотерапии, топография опухоли, количество курсов лекарственного лечения (химиотерапии или гормонотерапии), морфологический тип опухоли, вид лучевого лечения, стадия заболевания, количество курсов лучевого лечения и факт проведения мастэктомии по Маддену (А15.08). The prototype of the overall survival prediction model was developed using real data from 23,280 breast cancer patients collected at the Krasnoyarsk Regional Clinical Oncological Dispensary named after A.I. Kryzhanovsky for the period 2014-2024. In this study, the following regression models were employed: Random Forest (R2 = 0,80), Gradient Boosting (R2 = 0,73), and Regression model based on the outputs from both Random Forest and Gradient Boosting. The most significant features identified by these models were then used to construct a Cox model with a C-index of 0.75. The most important prognostic factors influencing overall survival were identified: TNM classification, number of chemotherapy courses, tumor topography, number of drug treatments (chemotherapy or hormone therapy), morphological type of tumor, type of radiotherapy, stage of disease, number of radiotherapy courses and Madden mastectomy (A15.08).

Ссылки на полный текст

Издание

Журнал: ИТ. Наука. Креатив

Номера страниц: 331-340

Место издания: Омск

Персоны

  • Зарубин Е.Ю. (Красноярский государственный медицинский университет им. проф. В. Ф. Войно-Ясенецкого)
  • Лукьянова Н.А. (Сибирский федеральный университет)
  • Голденок Е.Е. (Сибирский федеральный университет)

Вхождение в базы данных