ISSN 2411–4448 EN mail@intsysmagazine.ru

Методы и алгоритмы автоматического извлечения информации из научных текстов для создания тезауруса научной терминологии

Аннотация

В статье предлагается метод автоматического построения тезауруса научной терминологии, основанный на алгоритмах извлечения многословных терминов из специальных энциклопедий и научных публикаций. Представлены результаты работы алгоритмов создания и пополнения тезауруса на примере обработки математических текстов. Предложен алгоритм сравнительного семантического анализа научных публикаций, а также способы количественной оценки их семантического сходства.

Ключевые слова: аспектно-ориентированный анализ, научный лексикон, семантический граф, классификация научных текстов, автоматическая обработка неструктурированных текстов.

BibTeX
@article{IS-Vopilova-Kryuchkova2024,
  author  = {Вопилова, Елена Владимировна and Крючкова, Елена Николаевна},
  title   = {{Методы и алгоритмы автоматического
   извлечения информации из научных
 текстов для создания тезауруса научной
              терминологии}},
  journal = {Интеллектуальные системы. Теория и приложения},
  year    = {2024},
  volume  = {28},
  number  = {4},
  pages   = {21--31},
}
AMSBIB
\RBibitem{IS-Vopilova-Kryuchkova2024}
\by Е.\,В.~Вопилова, Е.\,Н.~Крючкова
\paper Методы и алгоритмы автоматического
   извлечения информации из научных
 текстов для создания тезауруса научной
              терминологии
\jour Интеллектуальные системы. Теория и приложения
\yr 2024
\vol 28
\issue 4
\pages 21--31
Опубликовано на условиях лицензии Creative Commons Attribution 4.0 International (CC BY 4.0)

← К номеру журнала

× Issue cover