Posts Tagged ‘Чуприна Кристина’

Методы извлечения именованных сущностей из текстов с использованием категорийной структуры Википедии (29.04.14)

Задача распознавания именованных сущностей состоит в обнаружении и классификации элементов текста — слов и последовательностей слов — по предопределенным категориям. Примерами таких категорий могут являтся категории «личные имена» «географические названия», «названия организаций». Распознавание именованных сущностей находит применение в таких приложениях обработки естественного языка, как автоматизированный сбор новостей, вопросно-ответные системы, кросс-языковой информационный поиск, машинный перевод.

В рамках доклада будут рассмотрены ключевые вопросы построения систем распознавания именованных сущностей. Также будет проведен обзор существующих методов использования Википедии для решения задачи распознавания именованных сущностей.

Докладчик: Кристина Чуприна

Презентация (pdf)

Тематическое моделирование текстов с учетом временного фактора (11.12.2012)

Доклад посвящен аспектам тематического моделирования динамических коллекций текстовых документов, то есть коллекций, документы которых разделены на группы в соответствие с временем их создания. Также будет рассмотрена динамическая вероятностная тематическая модель (Dynamic Hierarchical Dirichlet Process Model), позволяющая моделировать такие коллекции документов.

Докладчик: Кристина Чуприна

Материалы:

  1. Mining Text Data (Springer) Ed. Charu Aggarwal, ChengXiang Zhai, March 2012. Chapter 8.
  2. A. Ahmed, E. Xing. Timeline: A Dynamic Hierarchical Dirichlet Process Model for Recovering Birth/Death and Evolution of Topics in Text Stream, 2012.

Презентация с семинара

Распознавание и классификация именованных сущностей (1.11.11)

В докладе рассказывается о проблеме извлечения из текста и классификации именованных сущностей (named entity), некоторых методах их распознавания, приводятся наиболее часто используемые для этого признаки. Особое внимание уделено вопросу тегирования последовательностей и персептронному алгоритму.

Докладчик: Кристина Чуприна

Bibliography:

  • David Nadeau, Satoshi Sekine. A survey of named entity recognition and classification. 2007.
  • Michael Collins. Discriminative training methods for hidden markov models: Theory and experiments with perceptron algorithms. 2002.
  • Yoav Freund, Robert E. Schapire. Large Margin Classification Using the Perceptron Algorithm. 1998.

Презентация с семинара (pdf)