Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: ИТ. Наука. Креатив; Омск; Омск
Год издания: 2025
Ключевые слова: методы машинного обучения, нейронная сеть, классификация, медицинская диагностика, гипотиреоз, гипертиреоз, machine learning methods, neural network, classification, medical diagnosis, bone fractures
Аннотация: В исследовании для диагностики заболеваний щитовидной железы предложено решение задачи классификации пациентов на три класса (здоровых людей, с гипотиреозом, с гипертиреозом) классическими методами машинного обучения (опорных векторов, k-ближайших соседей, деревьев решений), ансамблевыми методами (случайный лес, экстремальный градиПоказать полностьюентный бустинг, классификатор голосований) и нейронной сетью. А также проведен сравнительный анализ качества реализованных классификационных моделей. Вычислительные эксперименты проведены на базе данных из открытого репозитория UCI Irvine. Наилучшие результаты классификации показали ансамбли экстремальный градиентный бустинг и случайный лес в обоих случаях, как на основе признаков, предварительно отобранных методом главных компонент, так и на основе множества всех признаков без предварительного отбора. Значения точности классификации во втором случае выросли на 6,95% у модели экстремального градиентного бустинга и на 7,8% у модели случайного леса, а значения F1-score увеличились на 7,93% и 8,54% соответственно. При этом методы классификации на основе метода главных компонент более эффективны по временным затратам. Three The study presents a solution for classifying patients into three categories (healthy, hypothyroid, or hyperthyroid) using both traditional machine learning techniques (Support Vector Machines, K-Nearest Neighbors, and Decision Trees) and advanced approaches like ensemble methods (Random Forests, Gradient Boosting, Voting Classifier) and Neural Network in order to diagnose thyroid disorders effectively. A comparative analysis of the performance of the implemented classification models has been conducted. Computational experiments were performed using datasets obtained from the open repository UCI Irvine. Both XGBoost and Random Forest ensembles achieved the best classification results across scenarios, whether based on features selected through Principal Component Analysis or utilizing all features without prior selection. The values of accuracy in the second case increased for the XGBoost model by 6,95% and for the Random Forest model by 7,8%, while F1-score increased by 7,93% and 8,54%, respectively. At the same time, classification methods based on principal component method are more time-efficient.
Журнал: ИТ. Наука. Креатив
Номера страниц: 341-349
Место издания: Омск