Archive for Октябрь 21st, 2014

Методы извлечения терминов из коллекции текстов предметной области (28.10.14)

Автоматическое извлечение терминов является важным этапом во многих задачах, связанных с обработкой текстов предметной области. К таким задачам относятся построение глоссариев, тезаурусов или онтологий, информационный поиск, извлечение информации, машинный перевод, классификация и кластеризация документов и другие. К настоящему времени разработано множество методов автоматического извлечения терминов, однако их качество остается достаточно низким, при этом большая часть методов существенно зависит от языка и предметной области входных текстов.
В докладе рассматриваются наиболее популярные методы извлечения терминов из коллекции текстов предметной области, а также предлагаются новые методы, основанные на использовании Википедии и алгоритмов обучения на положительных и неразмеченных примерах.

Докладчик: Никита Астраханцев

Презентация: atr_presentation

Видео: http://www.youtube.com/watch?v=jeEbbq_Rxqc