Обзор методов автоматического реферирования текстов (16.04.2013)

Доклад посвящен методам автоматического реферирования текстов. Будут рассмотрены наиболее распространенные задачи автоматического реферирования. Также будет дан краткий обзор основных подходов, применяющихся в системах автоматического реферирования. Дополнительно будут рассмотрены автоматические и автоматизированные методы оценки качества работы систем автоматического реферирования.

Докладчик: Майоров Владимир

Материалы:

Jurafsky D., Martin J. 2008. Speech and Language Processing (Second edition). 787-807.
Lloret E., Palomar M. 2012. Text summarization in progress: a literature review. Artificial Intelligence Review 37.1: 1-41.
Suneetha S. 2011. Automatic Text Summarization: The Current State of the art. International Journal of Science and Advanced Technology. 283-293.

Презентация с семинара

Сравнение алгоритма кластеризации на основе отношения α-квазиэквивалентности с классическими иерархическими алгоритмами на синтетических наборах данных (16.10.12)

Кластеризация — задача разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Кластеризация является одной из фундаментальных задач в Data Mining и активно применяется в прогнозировании, анализе текстов, сегментации изображений и других областях.
В докладе рассматривается алгоритм кластеризации на основе отношения α-квазиэквивалентности и проводится сравнение его эффективности с классическими иерархическими алгоритмами, такими как Greedy Agglomerative/Divisive Clustering и Bisecting k-means, на синтетических наборах данных.

Докладчик: Максим Варламов

Материалы:

Баргесян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. – СПб.: БХВ-Петербург, 2004. – 336 с.
Воронцов К.В. Лекции по алгоритмам кластеризации и многомерного шкалирования. 2007.
A.K. Jain, M.N. Murty, P.J. Flynn. Data Clustering. 1999.
Yaling Pei, Osmar Zaïane. A synthetic data generator for clustering and outlier analysis. 2006.

Презентация с семинара (pdf)

Кластеризация: K-means, C-means, Fuzzy c-means, иерархические методы (6.12.11)

Кластеризация (англ.clustering) – это автоматическое разбиение множества элементов на группы (кластеры) в зависимости от степени их схожести.
В докладе рассказывается о самом понятии кластеризации и её основных алгоритмах. Приводится классификация алгоритмов кластеризации и разновидности функции-метрики. Проводится обзор некоторых методов кластеризации: метод k-средних, k-medoids, метод нечеткой кластеризации (fuzzy c-means), иерархические алгоритмы.
Также освещаются достоинства и недостатки рассмотренных методов.

Докладчик: Агаев Нурлан

Материалы:

Data Clustering (A.K. JAIN, M.N. MURTY, P.J. FLYNN), 1999 [http://nd.edu/~flynn/papers/Jain-CSUR99.pdf]
A Comprehensive Overview of Basic Clustering Algorithms (Glenn Fung), 2001
Principles and Theory for Data Mining and Machine Learning (Bertrand Clarke, Ernest Fokou´e, Hao Helen Zhang)
Лекции по алгоритмам кластеризации и многомерного шкалирования (К. В. Воронцов), 2007

презентация семинара (pdf)

Управление данными и информационные системы

Научный семинар отдела Информационных систем Института системного программирования им. В.П. Иванникова РАН

Posts Tagged ‘Майоров Владимир’

Обзор методов автоматического реферирования текстов (16.04.2013)

Сравнение алгоритма кластеризации на основе отношения α-квазиэквивалентности с классическими иерархическими алгоритмами на синтетических наборах данных (16.10.12)

Кластеризация: K-means, C-means, Fuzzy c-means, иерархические методы (6.12.11)