Archive for Декабрь, 2012

Методы обнаружения описания событий в социальной сети Твиттер (18.12.2012)

Доклад посвящен методам обнаружения описания событий в социальной сети Твиттер на основе скрытых марковских модели. В докладе рассматриваются методы обнаружения событий и методы резюмирования. Целью обнаружения событий является нахождение нового или упоминавшегося в прошлом события, событие относится к конкретному факту, который происходит в определенное время и в определенном месте. Ставится задача обнаружения конкретного события на основе сообщений Твиттера и выбор ключевых сообщений, соответствующих этому событий. В качестве решения предлагается алгоритм SummHMM, основанный на скрытых марковских моделях.

Докладчик: Виталий Мордань

Материалы:

  1. Deepayan Chakrabarti and Kunal Punera. Event Summarization using Tweets. Yahoo! Research, 701 1st Avenue. Sunnyvale, CA 94089.
  2. J. Allan, R. Papka, and V. Lavrenko. On-Line New Event Detection and Tracking. SIGIR. 1998.
  3. Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo. Earthquake Shakes Twitter Users: Real-time Event Detection by Social Sensors. The University of Tokyo. Yayoi 2-11-16, Bunkyo-ku. Tokyo, Japan.
  4. Yihong Gong, Xin Liu. Generic Text Summarization Using Relevance Measure and Latent Semantic Analysis. NEC USA, C & C Research Laboratories.

Презентация с семинара

Тематическое моделирование текстов с учетом временного фактора (11.12.2012)

Доклад посвящен аспектам тематического моделирования динамических коллекций текстовых документов, то есть коллекций, документы которых разделены на группы в соответствие с временем их создания. Также будет рассмотрена динамическая вероятностная тематическая модель (Dynamic Hierarchical Dirichlet Process Model), позволяющая моделировать такие коллекции документов.

Докладчик: Кристина Чуприна

Материалы:

  1. Mining Text Data (Springer) Ed. Charu Aggarwal, ChengXiang Zhai, March 2012. Chapter 8.
  2. A. Ahmed, E. Xing. Timeline: A Dynamic Hierarchical Dirichlet Process Model for Recovering Birth/Death and Evolution of Topics in Text Stream, 2012.

Презентация с семинара