ОПТИМИЗАЦИЯ ДАТАСЕТОВ ДЛЯ МАШИННОГО ОБУЧЕНИЯ: ВЫЗОВЫ И РЕШЕНИЯ В ЗАДАЧАХ ДЕТЕКЦИИ

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Актуальные проблемы авиации и космонавтики; Красноярск; Красноярск

Год издания: 2025

Ключевые слова: машинное обучение, датасет, качество данных, оптимизация данных, детекция объектов, переобучение, беспилотные аппараты, machine learning, dataset, Data Quality, data optimization, object detection, overfitting, unmanned aerial vehicles

Аннотация: В статье исследуются основные трудности, связанные с выбором и оптимизацией наборов данных для обучения моделей машинного обучения. Среди них: низкое качество данных (ошибки в разметке объектов и метках, артефакты на изображениях, дисбаланс классов), недостаточный объем выборки (риск переобучения и снижение метрик качества), избытоПоказать полностьючность данных (повышенные вычислительные затраты), избыточность признаков (усложнение моделей) и несоответствие типа данных целям задачи. The article explores the primary challenges associated with the selection and optimization of datasets for training machine learning models. These include: poor data quality (errors in object bounding boxes and labels, image artifacts, class imbalance), insufficient sample size (risk of overfitting and reduced performance metrics), data redundancy (increased computational costs), feature redundancy (model complexity), and mismatch between data type and task objectives.

Ссылки на полный текст

Издание

Журнал: Актуальные проблемы авиации и космонавтики

Номера страниц: 37-39

Место издания: Красноярск

Персоны

  • Ермиенко Н.А. (Сибирский федеральный университет)
  • Михалев А.С. (Сибирский федеральный университет)
  • Гулютин Н.Н. (Сибирский федеральный университет)

Вхождение в базы данных