Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts tagged Чуприна Кристина

Задача распознавания именованных сущностей состоит в обнаружении и классификации элементов текста — слов и последовательностей слов — по предопределенным категориям. Примерами таких категорий могут являтся категории «личные имена» «географические названия», «названия организаций». Распознавание именованных сущностей находит применение в таких приложениях обработки естественного языка, как автоматизированный сбор новостей, вопросно-ответные системы, кросс-языковой информационный поиск, машинный перевод. В […]

Доклад посвящен аспектам тематического моделирования динамических коллекций текстовых документов, то есть коллекций, документы которых разделены на группы в соответствие с временем их создания. Также будет рассмотрена динамическая вероятностная тематическая модель (Dynamic Hierarchical Dirichlet Process Model), позволяющая моделировать такие коллекции документов. Докладчик: Кристина Чуприна Материалы: Mining Text Data (Springer) Ed. Charu Aggarwal, ChengXiang Zhai, March 2012. […]

В докладе рассказывается о проблеме извлечения из текста и классификации именованных сущностей (named entity), некоторых методах их распознавания, приводятся наиболее часто используемые для этого признаки. Особое внимание уделено вопросу тегирования последовательностей и персептронному алгоритму. Докладчик: Кристина Чуприна Bibliography: David Nadeau, Satoshi Sekine. A survey of named entity recognition and classification. 2007. Michael Collins. Discriminative training methods for […]