Меры семантической близости (11.10.11)

Определение семантической близости документов – важная задача, лежащая в основе полнотекстового поиска по интернету, кластеризации документов и пр. На семинаре будут рассмотрены как методы, опирающиеся на лексику документов (векторная модель, латентно-семантический анализ), так и подходы, рассматривающие корпус документов, как граф. Во втором случае, будут упомянуты, локальные методы, определяющие близость документов через общих соседей, и глобальные, рекурсивно подсчитывающие близость для всех пар вершин.

Докладчик: Тимофей Федотов

Материалы:

Турдаков Д.Ю. «Методы разрешения лексической многозначности, основанные на семантической близости в сетях документов». Глава 2.2
Jeh , Widom «SimRank: A Measure of Structural-Context Similarity»
Латентно-семантический анализ. http://habrahabr.ru/blogs/algorithm/110078/

Презентация с семинара (pptx)

Пн	Вт	Ср	Чт	Пт	Сб	Вс
« Сен				Ноя »
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

Управление данными и информационные системы

Научный семинар отдела Информационных систем Института системного программирования им. В.П. Иванникова РАН

Последние записи

Календарь