Методы и алгоритмы автоматического извлечения информации из научных текстов для создания тезауруса научной терминологии
Опубликована: 2024 год, том 28, выпуск 4, С. 21–31
Аннотация
В статье предлагается метод автоматического построения тезауруса научной терминологии, основанный на алгоритмах извлечения многословных терминов из специальных энциклопедий и научных публикаций. Представлены результаты работы алгоритмов создания и пополнения тезауруса на примере обработки математических текстов. Предложен алгоритм сравнительного семантического анализа научных публикаций, а также способы количественной оценки их семантического сходства.
Ключевые слова: аспектно-ориентированный анализ, научный лексикон, семантический граф, классификация научных текстов, автоматическая обработка неструктурированных текстов.
BibTeX
@article{IS-Vopilova-Kryuchkova2024,
author = {Вопилова, Елена Владимировна and Крючкова, Елена Николаевна},
title = {{Методы и алгоритмы автоматического
извлечения информации из научных
текстов для создания тезауруса научной
терминологии}},
journal = {Интеллектуальные системы. Теория и приложения},
year = {2024},
volume = {28},
number = {4},
pages = {21--31},
}
AMSBIB
\RBibitem{IS-Vopilova-Kryuchkova2024}
\by Е.\,В.~Вопилова, Е.\,Н.~Крючкова
\paper Методы и алгоритмы автоматического
извлечения информации из научных
текстов для создания тезауруса научной
терминологии
\jour Интеллектуальные системы. Теория и приложения
\yr 2024
\vol 28
\issue 4
\pages 21--31
EN