Объектная сегментация изображений слабо структурированных документов : доклад, тезисы доклада

Описание

Тип публикации: доклад, тезисы доклада, статья из сборника материалов конференций

Конференция: Будущее машиностроения России; Москва; Москва

Год издания: 2025

Ключевые слова: объектная сегментация, слабо структурированные документы, машинное обучение, распознавание текста, предобработка изображений, object segmentation, weakly structured documents, machine learning, text recognition, image preprocessing

Аннотация: В современных информационных системах большое внимание уделяется задачам распознавания и анализа слабо структурированных документов, включая машиночитаемые и рукописные форматы. Настоящее исследование рассматривает подходы к объектной сегментации изображений таких документов с использованием современных технологий машинного обучениПоказать полностьюя и методов обработки изображений. В работе представлен подробный анализ этапов обработки изображений, а также влияние различных параметров на качество результирующих моделей. Обсуждаемая методология включает предобработку, сегментацию и распознавание текста, что позволяет автоматизировать извлечение данных в различных сферах, включая налогообложение. In modern information systems, much attention is paid to the tasks of recognition and analysis of poorly structured documents, including machine-readable and handwritten formats. The present study considers approaches to object segmentation of images of such documents using modern machine learning technologies and image processing methods. The paper presents a detailed analysis of the image processing steps as well as the impact of various parameters on the quality of the resulting models. The methodology discussed includes preprocessing, segmentation and text recognition, which allows automating data extraction in various fields, including taxation.

Ссылки на полный текст

Издание

Журнал: Будущее машиностроения России

Номера страниц: 139-142

Место издания: Москва

Персоны

Вхождение в базы данных