Archive for Октябрь, 2015

Аспектно-ориентированный анализ эмоциональной окраски: приложения и методы (03.11.2015)

В настоящее время широкое распространение получили веб-сайты, предоставляющие пользователям возможность оставить отзыв о товаре / услуге. Нередко предоставляется и возможность оценить разные аспекты товара / услуги (например, разнообразие блюд в меню ресторана) по некоторой шкале.

В связи с этим представляет интерес задача аспектно-ориентированного анализа эмоциональной окраски. В данной задаче автоматическая система, анализируя текст отзыва, обязана предоставить информацию о том, в каких его частях, какие аспекты и как оцениваются.

В данном докладе будут рассмотрены приложения данной задачи, а также методы, предложенные участниками двух сессий тестирования систем аспектно-ориентированного анализа эмоциональной окраски: SemEval-2015 (язык: английский; предметные области: рестораны, ноутбуки) и SentiRuEval-2015 (язык: русский; предметные области: рестораны, автомобили).

Докладчик: Иван Андрианов

Слайды: pdf

Методы автоматического исправления орфографических ошибок (27.10.2015)

Задача автоматического исправления ошибок в текстах на естественных языках возникла уже более полувека назад и остаётся актуальной и сейчас. В ходе доклада будет произведён обзор существующих решений задач выявления и исправления орфографических ошибок в текстах. Также некоторые методы будут рассмотрены применительно к русскому языку. Будет произведён анализ качества работы этих методов и предложены варианты их улучшения.

Докладчик: Кириллов Алексей

Список использованной литературы:

  1. Karen Kukich. «Techniques for Automatically Correcting Words in Text». (December 1992).
  2. Priscila A. Gimenes, Norton T. Roman и Ariadne M. B. R. Carvalho. «Spelling Error Patterns in Brazilian Portuguese.» (March 2015)
  3. Noura Farra et all. «Generalized Character-Level Spelling Error Correction.» (2014)
  4. Bo Han и Timothy Baldwin. «Lexical Normalisation of Short Text Messages: Makn Sens a #twitter.» (2011)
  5. Max Kaufmann и Jugal Kalita. «Syntactic Normalization of Twitter Messages.» (2011)
  6. Bidyut Baran Chaudhuri. «Reversed word dictionary and phonetically similar word grouping based spell-checker to Bangla text». (2001)
  7. Kristina Toutanova и Robert C. Moore. «Pronunciation Modeling for Improved Spelling Correction.» (2002)

Краудсорсинг для поиска информации (20.10.2015)

Многие информационные запросы имеют огромный диапазон поиска. Например, определить место, где сделана фотография или найти объект в городе. Такие задачи не поддаются решению с помощью методов машинного обучения, и ширина диапазона поиска не позволяет найти ответ организациям с ограниченным количеством сотрудников. Эти задачи можно решить при помощи краудсорсинга, когда о поиске узнает достаточное количество людей, которые распространяют запрос через соцсети.
В докладе будут представлены несколько примеров использования краудсорсинга:

проверка достоверности информации
рекрутинг по рекомендациям
поиск спрятанных объектов

В доклад также войдет анализ механизмов мотивации участников краудсорсинга с точки зрения теории игр.

Докладчик: Виктор Народицкий. (co-founder of Veri.ly, UK)

Слайды: pdf

Видео: https://www.youtube.com/watch?v=YF-eElCgkxY

Распределение студентов (2015-2016) по научным руководителям

3 курс ВМК и ВШЭ и часть 4 курса МФТИ, обратите внимание: обновлена страница со списком студентов спецсеминара.

Напишите своим научным руководителям, чтобы узнать, что вам нужно сделать, чтобы начать работать над курсовыми/дипломами.

Оценка влиятельности пользователей социальных сетей: методы и приложения (13.10.15)

В настоящее время при исследовании социальных сетей и решении прикладных задач, связанных с вирусным маркетингом, рекомендацией товаров и услуг или социальным поиском, возникает проблема оценки влиятельности пользователей в социальной сети. Доклад будет посвящён обзору существующих решений в этой области, методов оценки качества определения влиятельности пользователей в социальных сетях, а также различных приложений, тесно связанных с влиятельностью.

Докладчик: Кирилл Чихрадзе