Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts tagged Сильвестров Алексей

Анализ тональности текстов (sentiment analysis) – область прикладной лингвистики, задачей которой является выявление в тексте эмоционально окрашенной лексики и эмоциональной оценки автора по отношению к объектам, речь о которых идет в тексте. В докладе будут рассмотрены некоторые методы, разработанные за последние 5 лет для анализа сообщений в микроблоге Twitter и других социальных медиа-сервисах. Докладчик: Алексей Сильвестров. Материалы: Thelwall, M., […]

Машины Опорных Векторов – это семейство алгоритмов классификации вида “обучение с учителем”. В докладе будут рассмотрены: Определение оптимальной гиперплоскости в случае линейно разделимых и произвольных данных, SVM как задача квадратичного программирования, Ядровые функции и ядровой переход. Все необходимые теоремы и понятия алгебры и  оптимизации будут введены по ходу доклада. Докладчик:  Алексей Сильвестров Литература: http://cs229.stanford.edu/notes/cs229-notes2.pdf – Стенфордский курс Machine Learning http://www.machinelearning.ru/wiki/images/2/25/SMAIS11_SVM.pdf – с/к СМАИС […]

В докладе освещены шаблоны проектирования распределенных программ в модели MapReduce. В частности уделяется особое внимание разработке для фреймворка Apache Hadoop. Будут рассмотрены проблемы хранения промежуточных данных, сортировки пар ключ-значение по значению(secondary sorting), очередности вычисления данных(например, при вычислении числителя, знаменателя и их отношения). Докладчик: Алексей Сильвестров Материалы: Jimmy Lin and Chris Dyer. Data-Intensive Text Processing with […]

Доклад посвящен задаче обнаружения границ абзацев в тексте (paragraph boundary identification). Будет рассмотрена реализация, основанная на принципе постоянства энтропийной скорости (entropy rate constancy). Докладчик: Сильвестров Алексей Материалы: C. Sporleder, M. Lapata. Automatic Paragraph Identification: A Study across Languages and Domains. EMNLP 2004 (http://ilk.uvt.nl/~caroline/papers/SporlederLapata.pdf) D. Genzel, E.Charniak Variation of Entropy and Parse Trees of Sentences as […]

В докладе делается обзор  исследований в области поиска и классификации именованных сущностей (Named entity recognition and classification) за последние 14 лет, от эвристик и созданных вручную правил  до методов машинного обучения. Кратко рассказано об использующихся методах оценки точности и полноты алгоритмов. В заключении  рассматривается система Nymble, основанная на HMM. докладчик: Сильвестров Алексей. Материалы: nlp.cs.nyu.edu/sekine/papers/li07.pdf www.ldc.upenn.edu/acl/A/A97/A97-1029.pdf […]