Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций
Конференция: Актуальные проблемы авиации и космонавтики; Красноярск; Красноярск
Год издания: 2025
Ключевые слова: машинное обучение, датасет, качество данных, оптимизация данных, детекция объектов, переобучение, беспилотные аппараты, machine learning, dataset, Data Quality, data optimization, object detection, overfitting, unmanned aerial vehicles
Аннотация: В статье исследуются основные трудности, связанные с выбором и оптимизацией наборов данных для обучения моделей машинного обучения. Среди них: низкое качество данных (ошибки в разметке объектов и метках, артефакты на изображениях, дисбаланс классов), недостаточный объем выборки (риск переобучения и снижение метрик качества), избытоПоказать полностьючность данных (повышенные вычислительные затраты), избыточность признаков (усложнение моделей) и несоответствие типа данных целям задачи. The article explores the primary challenges associated with the selection and optimization of datasets for training machine learning models. These include: poor data quality (errors in object bounding boxes and labels, image artifacts, class imbalance), insufficient sample size (risk of overfitting and reduced performance metrics), data redundancy (increased computational costs), feature redundancy (model complexity), and mismatch between data type and task objectives.
Журнал: Актуальные проблемы авиации и космонавтики
Номера страниц: 37-39
Место издания: Красноярск