Улучшение качества векторных представлений слов за счёт использования нескольких источников представлений
Получена: 03.03.2026 Доработана: 10.03.2026 Принята: 19.03.2026
Опубликована: 2026 год, том 30, выпуск 1, С. 87–100
Аннотация
Векторные представления слов активно используются в задачах машинного перевода, рекомендательных системах и информационном поиске. Качество таких представлений, оцениваемое как ранговая корреляция с экспертными оценками семантической близости, остаётся ограниченным. В данной работе предлагается подход к повышению качества векторных представлений слов путём слияния нескольких независимых источников первичных представлений. Вводятся понятия монотонных и антимонотонных четвёрок слов, формулируется и проверяется гипотеза о том, что информация, содержащаяся в монотонных четвёрках, позволяет восстановить истинный порядок близостей для антимонотонных четвёрок. Предложены метод отбора четвёрок слов, двухшаговая процедура коррекции с использованием полносвязного слоя и функции потерь на четвёрках (quadruplet loss), а также способ оценки качества полученных представлений. Экспериментальные результаты на моделях Word2Vec и GloVe, обученных на лемматизированной Википедии, демонстрируют возможность повышения качества представлений при оценке на экспертных наборах данных MEN, SimLex-999 и WordSim-353.
Ключевые слова: векторные представления слов, семантическая близость, слияние данных, quadruplet loss, многомерное шкалирование, Word2Vec, GloVe
BibTeX
@article{IS-Kolosov-Maysuradze2026,
author = {Колосов, Алексей Михайлович and Майсурадзе, Арчил Ивериевич},
title = {{Улучшение качества векторных представлений слов за счёт использования нескольких источников представлений}},
journal = {Интеллектуальные системы. Теория и приложения},
year = {2026},
volume = {30},
number = {1},
pages = {87--100},
}
AMSBIB
\RBibitem{IS-Kolosov-Maysuradze2026}
\by А.\,М.~Колосов, А.\,И.~Майсурадзе
\paper Улучшение качества векторных представлений слов за счёт использования нескольких источников представлений
\jour Интеллектуальные системы. Теория и приложения
\yr 2026
\vol 30
\issue 1
\pages 87--100
English
