Преодоление ограничений обучения сиамских нейронных сетей в задаче оптического распознавания символов

Скачать полный текст

Опубликована: 2026 год, том 30, выпуск 1, С. 101–123

Аннотация

Разработка моделей глубокого обучения для задач классификации представляет особую сложность при работе с большим количеством классов в условиях ограниченных данных и вычислительных ресурсов. Метрическое обучение предлагает перспективный подход к решению этой проблемы, хотя его эффективность часто ограничивается присущими недостатками стандартных функций потерь, таких как контрастивная и триплетная потери, а также неоптимальными стратегиями выбора обучающих примеров. В данной работе представлены решения этих проблем: новый автовероятностный метод майнинга для выбора примеров и улучшенная метрическая функция потерь. Предложенный автовероятностный метод майнинга помогает выбирать наиболее информативные пары примеров для обучения сиамских нейронных сетей. В сочетании с ранее разработанным методом автокластеризации этот метод повышает эффективность обучения, максимизируя полезность данных и минимизируя вычислительные затраты. Помимо этого, вводится новая метрическая функция потерь на основе триплетов, учитывающая специфику кластеров и разработанная для преодоления конкретных недостатков традиционных контрастивной и триплетной функций потерь, тем самым улучшая процесс формирования признаковых эмбеддингов. Эффективность предложенных методов была подтверждена в ходе экспериментов по оптическому распознаванию символов на наборах данных PHD08 (корейский алфавит) и Omniglot. Для полного корейского алфавита в наборе данных PHD08 новая функция потерь со случайным майнингом достигла точности классификации \(82,6\%\), установив новый эталонный показатель. Используя сокращенный алфавит, был установлен базовый уровень в \(88,6\%\) на PHD08. Применение только автовероятностного метода майнинга улучшило точность до \(90,6\%\) (\(+2,0\%\)), а его комбинация с автокластеризацией дополнительно увеличила её до \(92,3\%\) (\(+3,7\%\)). На наборе данных Omniglot предложенный метод майнинга достиг \(92,32\%\), а в сочетании с автокластеризацией этот показатель вырос до \(93,17\%\). Результаты демонстрируют, что предложенные функция потерь и стратегия майнинга представляют собой эффективное решение для задач метрического обучения, особенно в сценариях, характеризующихся большим количеством классов и ограниченными ресурсами.

BibTeX
@article{IS-Mokin2026,
  author  = {Мокин, Арсений Кириллович},
  title   = {{Преодоление ограничений обучения сиамских нейронных сетей в задаче оптического распознавания символов}},
  journal = {Интеллектуальные системы. Теория и приложения},
  year    = {2026},
  volume  = {30},
  number  = {1},
  pages   = {101--123},
}
AMSBIB
\RBibitem{IS-Mokin2026}
\by А.\,К.~Мокин
\paper Преодоление ограничений обучения сиамских нейронных сетей в задаче оптического распознавания символов
\jour Интеллектуальные системы. Теория и приложения
\yr 2026
\vol 30
\issue 1
\pages 101--123
Creative Commons Attribution 4.0 International (CC BY 4.0)

← К номеру журнала