Завтра, в пятницу, 27 сентября и в понедельник, 30 сентября можно подойти в институт и поговорить с научными руководителями. О своем приходе желательно предупредить по телефону +7(495) 912-56-59 (ext. 4461), иначе может оказаться, что разговаривать вам будет не с кем.

До 6 утра вторника, 1 октября, на почту, которую я написал на доске, вы должны прислать список тем. Темы должны быть написаны по одной на каждой строке в порядке убывания приоритета (т.е. самую желанную тему следует писать первой). Список тем для справки в таблице ниже. Если до 6 утра вторника, 1 октября письма от вас не будет, то выбор темы для вас мы оставляем на свое усмотрение. Есть еще вариант перехода на другой семинар.

Во вторник перед семинаром мы опубликуем получившееся распределение тем по студентам.

Просьба отнестись к выбору темы серьезно, вам придется потратить на нее массу времени в течение года, не стесняйтесь подойти к научным руководителям, задать вопросы или попросить более подробных объяснений. Вы так же можете предложить свою тему.

Ниже список предложенных тем более-менее в порядке озвучивания.

Примерная тема Научный руководитель Курс
Меттоды поиска плагиата Ярослав Недумов 3-5
Применение баз знаний на основе словарей в обработке текста Иван Андрианов 3?, 4
Классификация текстов по стилям/жанрам Никита Астраханцев 3, 4
Распознавание нарушений лексической сочетаемости в тексте Никита Астраханцев 3?, 4
Поиск заимствованных терминов Никита Астраханцев 3, 4
Классификация концептов по логической категории Никита Астраханцев 3, 4
Извлечение терминологии с применением методов машинного обучения Денис Федоренко 3
Извлечение терминологии с помощью методов тематического моделирования Денис Федоренко 3, 4
Тематическое моделирование с использованием извлеченных концепций Андрей Гомзин 3
Исследование и разработка методов конструирования функционалов качества для тематических моделей Валерий Аванесов 4
Построение модели разрешения лексической многозначности методом PU-обучения Денис Федоренко 3, 4
Методы разрешения лексической многозначности (определения ключевых концепций текстовых документов), основанные на открытых базах знаний Андрей Сысоев 3, 4
Разрешение лексической многозначности для Twitter’а Ярослав Недумов 3, 4
Расчёт семантической близости концепций на основе кратчайших путей в графе Википедии Антон Коршунов 4, 5
Определение частей речи в текстах из социальных сетей Антон Коршунов 3, 4
Определение языковой принадлежности текстов из социальных сетей Антон Коршунов 3, 4
Определение спама в корпусах сообщений пользователей социальных сетей Антон Коршунов 4, 5
Использование социальных связей и социолингвистических признаков для определения скрытых атрибутов пользователей социальных сетей Антон Коршунов 4
Вопросно-ответная система для поиска кинофильмов Ярослав Недумов 3, 4
Извлечение информации из неструктурированных грамматически некорректных текстов Ярослав Недумов 3-5
Исследование и разработка методов распознавания речи Денис Турдаков 3
Исследование и разработка методов оптимизации выполнения запросов на примере хранилища данных Shark Денис Турдаков 3
Исследование и разработка фреймворков для обработки данных в формате RDF с поддержкой интерактивных запросов Денис Турдаков ?
Исследование работы планировщика в Spark Роман Пастухов ?
Исследование и разработка методов извлечения отношений из текстов на основе DBPedia Денис Турдаков 5
Исследование и разработка методов извлечения именованных сущностей из текстов с использованием категорийной структуры Википедии Денис Турдаков 4, 5
Разработка расширяемой системы управления базой знаний Денис Турдаков 4