Posts Tagged ‘Майоров Владимир’

Обзор методов автоматического реферирования текстов (16.04.2013)

Доклад посвящен методам автоматического реферирования текстов. Будут рассмотрены наиболее распространенные задачи автоматического реферирования. Также будет дан краткий обзор основных подходов, применяющихся в системах автоматического реферирования. Дополнительно будут рассмотрены автоматические и автоматизированные методы оценки качества работы систем автоматического реферирования.

Докладчик: Майоров Владимир

Материалы:

  1. Jurafsky D., Martin J. 2008. Speech and Language Processing (Second edition). 787-807.
  2. Lloret E., Palomar M. 2012. Text summarization in progress: a literature review. Artificial Intelligence Review 37.1: 1-41.
  3. Suneetha S. 2011. Automatic Text Summarization: The Current State of the art. International Journal of Science and Advanced Technology. 283-293.

Презентация с семинара

Сравнение алгоритма кластеризации на основе отношения α-квазиэквивалентности с классическими иерархическими алгоритмами на синтетических наборах данных (16.10.12)

Кластеризация — задача разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Кластеризация является одной из фундаментальных задач в Data Mining и активно применяется в прогнозировании, анализе текстов, сегментации изображений и других областях.
В докладе рассматривается алгоритм кластеризации на основе отношения α-квазиэквивалентности и проводится сравнение его эффективности с классическими иерархическими алгоритмами, такими как Greedy Agglomerative/Divisive Clustering и Bisecting k-means, на синтетических наборах данных.

Докладчик: Максим Варламов

Материалы:

  1. Баргесян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. – СПб.: БХВ-Петербург, 2004. – 336 с.
  2. Воронцов К.В. Лекции по алгоритмам кластеризации и многомерного шкалирования. 2007.
  3. A.K. Jain, M.N. Murty, P.J. Flynn. Data Clustering. 1999.
  4. Yaling Pei, Osmar Zaïane. A synthetic data generator for clustering and outlier analysis. 2006.

Презентация с семинара (pdf)

Кластеризация: K-means, C-means, Fuzzy c-means, иерархические методы (6.12.11)

Кластеризация (англ.clustering) – это автоматическое разбиение множества элементов на группы (кластеры) в зависимости от степени их схожести.
В докладе рассказывается о самом понятии кластеризации и её основных алгоритмах. Приводится классификация алгоритмов кластеризации и разновидности функции-метрики. Проводится обзор некоторых методов кластеризации: метод k-средних, k-medoids, метод нечеткой кластеризации (fuzzy c-means), иерархические алгоритмы.
Также освещаются достоинства и недостатки рассмотренных методов.

Докладчик: Агаев Нурлан

Материалы:

  • Data Clustering (A.K. JAIN, M.N. MURTY, P.J. FLYNN), 1999 [http://nd.edu/~flynn/papers/Jain-CSUR99.pdf]
  • A Comprehensive Overview of Basic Clustering Algorithms (Glenn Fung), 2001
  • Principles and Theory for Data Mining and Machine Learning (Bertrand Clarke, Ernest Fokou´e, Hao Helen Zhang)
  • Лекции по алгоритмам кластеризации и многомерного шкалирования (К. В. Воронцов), 2007

презентация семинара (pdf)