Archive for the ‘Аннотации’ Category

Разработка аппроксимации универсальной индукции на основе вывода рекурсивных графов решений (03.03.2015)

В докладе рассматриваются рекурсивные графы решений как способ аппроксимации универсальной индукции. Вначале дается общее понятие об универсальной индукции и показывается ее невычислимость. Представляется метод аппроксимации универсальной индукции с помощью деревьев решений. Затем вводятся графы решений как обобщение деревьев. Основное внимание уделено методу эффективного вычисления мат.ожидания по смеси графов, а также способу индексации подграфов для быстрого поиска подграфов одинаковой структуры.

Докладчик: Михаил Дробышевский

Презентация (pdf)

EgoLP: Fast and Distributed Community Detection in Billion-node Social Networks (09.12.2014)

Community structure is one of the most important and characteristic features of social networks. Numerous methods for discovering implicit user communities from a social graph of users have been proposed in recent years. However, most of them have performance and scalability issues which make them hardly applicable to population-wide analysis of modern social networks (billions of users and growing).

We present EgoLP – an efficient and fully distributed method for social community detection. The method is based on propagating community labels through the network with the help of friendship groups of individual users. Experimental evaluation of Apache Spark implementation of the method showed that it outperforms some state-of-the-art methods in terms of

a) similarity of extracted communities to the reference ones from synthetic networks;

b) precision of user attributes prediction in Facebook based solely on community memberships;

c) likelihood of the discovered community structure according to the proposed generative model.

At the same time, the method retains near-linear complexity in the number of edges and is thus applicable to social graphs of up to 10^9 users.

Speaker: Anton Korshunov

Презентация: modis-egolp

Видео: http://www.youtube.com/watch?v=_fuRWoSWV2Y

NetBlox: система для исследования модульной структуры сложных сетей (02.12.2014)

Доклад посвящён системе NetBlox, разработанной в отделе информационных систем для исследования сложных сетей, включая определение и анализ их модульной (кластерной) структуры. Основным приложением системы в настоящий момент является исследование сообществ пользователей социальных сетей. Известно множество программных пакетов, позволяющих моделировать и исследовать графы, но возможности кластерного анализа в большинстве из них достаточно ограничены, равно как и возможности расширения доступного набора инструментов.
NetBlox позволяет применять различные алгоритмы кластеризации с последующей визуализацией и детальным анализом найденных кластеров, исследовать известную структуру кластеров сети, исследовать зависимость качества кластеризации от используемых алгоритмов и их параметров, генерировать случайные графы с известной структурой кластеров для расширенного тестирования алгоритмов кластеризации, а также применять другие методы анализа структуры связей в исследуемых сетях. Кроме того, система позволяет добавлять новые алгоритмы изучения сложных сетей, способы оценки качества результатов их работы, а также способы анализа заранее известной или алгоритмически найденной структуры кластеров.

Докладчик: Илья Филоненко

Видео: http://www.youtube.com/watch?v=kK2Ul7DbB1w

Презентация: доклад по NetBlox (слайды)

Новый подход к вычислению SimRank (25.11.2014)

SimRank — популярный индекс похожести вершин графа нашедший применение во многих задачах, основным недостатком которого является высокая сложность вычисления и высокие затраты оперативной памяти. В данной работе предложена малоранговая аппроксимация симранка, вычисляемая за O(n^2r) и требующая O(nr) памяти (r – ранк аппроксимации), приводятся численные эксперименты на графах из коллекции DIMACS10 и графе Simple English Wikipedia.

Докладчик: Георгий Овчинников

Презентация: simrank_talk_ru

Видео: http://www.youtube.com/watch?v=rGBGOO0gmMI

word2vec и с чем его закусывают (11.11.2014)

Доклад посвящен двум недавно предложенным лог-линейным архитектурам для построения векторных представлений слов Skip-gram и Continuous Bag of Words, авторская реализация которых известна как word2vec. Эти архитектуры интересны по целому ряду причин: во-первых, на данный момент это самый быстрый метод построения представлений для слов, к примеру, английская википедия может быть обработана на одной машине всего за пару часов. Во-вторых, полученные представления сохраняют большое количество семантической информации (близкие по смыслу слова имеют близкие представления) и могут быть использованы в огромном числе приложений. В-третьих, обе архитектуры были получены не путем усложнения существующих подходов, как это часто бывает, а, напротив, упрощения. В докладе будут разобраны обе архитектуры, а также некоторые их расширения, например, для построения представлений на уровне абзацев и предложений.

Докладчик: Сергей Бартунов

Презентация: word2vec_ispras

Методы извлечения терминов из коллекции текстов предметной области (28.10.14)

Автоматическое извлечение терминов является важным этапом во многих задачах, связанных с обработкой текстов предметной области. К таким задачам относятся построение глоссариев, тезаурусов или онтологий, информационный поиск, извлечение информации, машинный перевод, классификация и кластеризация документов и другие. К настоящему времени разработано множество методов автоматического извлечения терминов, однако их качество остается достаточно низким, при этом большая часть методов существенно зависит от языка и предметной области входных текстов.
В докладе рассматриваются наиболее популярные методы извлечения терминов из коллекции текстов предметной области, а также предлагаются новые методы, основанные на использовании Википедии и алгоритмов обучения на положительных и неразмеченных примерах.

Докладчик: Никита Астраханцев

Презентация: atr_presentation

Видео: http://www.youtube.com/watch?v=jeEbbq_Rxqc

Обзор методов тематического моделирования для больших коллекций текстовых документов (21.10.14)

Задача тематического моделирования (topic modeling, определение тем текстовых документов) является объектом множества современных исследований. С ростом объемов обрабатываемых данных становится актуальной задача выполнить тематическое моделирование быстро и эффективно. Кроме того, данные могут поступать непрерывным потоком, что требует непрерывного до-обучения алгоритма в процессе работы (online learning).

В докладе будут рассмотрены современные алгоритмы тематического моделирования, применяемые к большим коллекциям текстовых документов. Особый упор будет сделан на аспекты реализации таких алгоритмов в распределенных системах.

Докладчик: Татьяна Борисова

Презентация: Doklad_21_oktyabrya_4

Видео: http://www.youtube.com/watch?v=NiHig51ksu0

Проверка статистических гипотез для сравнения алгоритмов классификации (14.10.14)

При проведение исследований часто возникает задача сравнения различных классификаторов. При этом численные показатели качества работы алгоритмов могут зависеть от случайных факторов и, следовательно прямое сравнение численных показателей не применимо. Более надёжный метод сравнения основан на технике проверки статистических гипотез и применение статистических критериев.

В ходе доклада будут рассмотрены основные понятия математической статистики и продемонстрированы некоторые статистические критерии (Манн-Уитни, ранговый тест Уилкоксона), применительно к задаче сравнения классификаторов.

Докладчик: Илья Козлов

Презентация: presentation

Видео: http://www.youtube.com/watch?v=6cnF8lQRYN0

Учи.ру — интерактивный, онлайн курс по математике для начальной школы (07.10.14)

Компания Учи.ру предлагает интересный и понятный, интерактивный, онлайн курс математики для начальной школы. Сейчас реализованы программы для первого и второго классов, разрабатываются задания для третьего и четвертого классов. Ученики проходят курс в индивидуальном темпе, в зависимости от своих знаний и способностей.

В данном докладе будет рассказано, как устроен продукт изнутри, какие технологии используются, рассмотрены проблемы, с которыми сталкивается образовательный стартап, а также какие технические и исследовательские задачи приходится решать на ежедневной основе.

Докладчик: Алексей Вахов, CTO uchi.ru

Презентация: isp-2014-vakhov_v2.pdf

Видео: http://www.youtube.com/watch?v=xajrvByhNds