АНАЛИЗ ВЛИЯНИЯ ГИПЕРПАРАМЕТРОВ НА ЭФФЕКТИВНОСТЬ OCR-МОДЕЛИ ДЛЯ ДОРЕФОРМЕННЫХ РУКОПИСНЫХ ТЕКСТОВ

Описание

Тип публикации: статья из журнала

Год издания: 2025

Идентификатор DOI: 10.31857/S0132347425030071

Ключевые слова: optical character recognition, hyperparameters, handwritten text recognition, pre-reform orthography, normalization modules, neural networks, historical documents, Model Architecture, accuracy, optimization, оптическое распознавание символов, гиперпараметры, распознавание рукописного текста, дореформенная орфография, модули нормализации, нейронные сети, исторические документы, архитектура модели, точность, оптимизация

Аннотация: В статье рассматривается влияние гиперпараметров на эффективность моделей оптического распознавания рукописного текста дореформенного периода на примере рукописных отчетов губернаторов Енисейской губернии XIX в. Проведен сравнительный анализ конфигураций моделей с различными архитектурными компонентами, включая модули нормализации,Показать полностьюблоки выделения признаков и предсказатели. Особое внимание уделено роли разрешения входного изображения и размера скрытых слоев в достижении оптимального баланса между точностью предсказания и вычислительными затратами. Полученные результаты позволяют определить ключевые параметры для разработки систем оптического распознавания символов, адаптированных к историческим текстам с нестандартной орфографией и сложной структурой. Перспективы дальнейших исследований включают оценку синтетических методов расширения обучающих данных и анализ альтернативных архитектур, таких как трансформеры. The article considers the influence of hyperparameters on the efficiency of models of optical handwriting recognition of pre-reform period on the example of handwritten reports of governors of the Yenisei province of the XIX century. A comparative analysis of model configurations with different architectural components, including normalization modules, feature extraction blocks and predictors, is carried out. Particular attention is paid to the role of input image resolution and the size of hidden layers in achieving an optimal balance between prediction accuracy and computational cost. The results obtained allow us to identify key parameters for the development of optical character recognition systems adapted to historical texts with non-standard orthography and complex structure. Prospects for further research include evaluating synthetic methods for extending training data and analyzing alternative architectures such as transformers.

Ссылки на полный текст

Издание

Журнал: Программирование

Выпуск журнала: 3

Номера страниц: 70-79

ISSN журнала: 01323474

Место издания: Москва

Издатель: Московский государственный университет им. М.В. Ломоносова, Российская академия наук

Персоны

  • Шерстнев П.А. (Центр Искусственного Интеллекта, Сибирский Федеральный Университет)
  • Кожин К.Д. (Центр Искусственного Интеллекта, Сибирский Федеральный Университет)
  • Пятаева А.В. (Центр Искусственного Интеллекта, Сибирский Федеральный Университет)

Вхождение в базы данных