Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Многие информационные запросы имеют огромный диапазон поиска. Например, определить место, где сделана фотография или найти объект в городе. Такие задачи не поддаются решению с помощью методов машинного обучения, и ширина диапазона поиска не позволяет найти ответ организациям с ограниченным количеством сотрудников. Эти задачи можно решить при помощи краудсорсинга, когда о поиске узнает достаточное количество людей, которые распространяют запрос через соцсети.
В докладе будут представлены несколько примеров использования краудсорсинга:

проверка достоверности информации
рекрутинг по рекомендациям
поиск спрятанных объектов

В доклад также войдет анализ механизмов мотивации участников краудсорсинга с точки зрения теории игр.

Докладчик: Виктор Народицкий. (co-founder of Veri.ly, UK)

Слайды: pdf

Видео: https://www.youtube.com/watch?v=YF-eElCgkxY

3 курс ВМК и ВШЭ и часть 4 курса МФТИ, обратите внимание: обновлена страница со списком студентов спецсеминара.

Напишите своим научным руководителям, чтобы узнать, что вам нужно сделать, чтобы начать работать над курсовыми/дипломами.

В настоящее время при исследовании социальных сетей и решении прикладных задач, связанных с вирусным маркетингом, рекомендацией товаров и услуг или социальным поиском, возникает проблема оценки влиятельности пользователей в социальной сети. Доклад будет посвящён обзору существующих решений в этой области, методов оценки качества определения влиятельности пользователей в социальных сетях, а также различных приложений, тесно связанных с влиятельностью.

Докладчик: Кирилл Чихрадзе

На семинаре 06 октября 2015 состоится сбор по поводу распределения тем курсовых и знакомства студентов с их руководителями (если еще не знакомы).

В одкладе рассматриваются результаты работы Леви и Голдберга, опубликованные в статье O. Levy, Y. Goldberg. Linguistic Regularities in Sparse and Explicit Word Representations, получившей приз за лучшую статью на конференции CoNLL, 2014.

В ходе доклада будут рассмотрены две модели представления слов на естественном языке в виде вещественнозначных векторов: на основе нейронных сетей (word2vec), а также явные представления, где используются частоты появлений слов в контексте других слов. Будут продемонстрированы лингвистические регулярности, которыми обладают результирующие представления, в частности, свойство аддитивности векторов. Будет проведено экспериментальное сравнение нейросетевых и явных моделей в задачах аналогии слов и показано, что нейронные сети являются не единственными моделями, успешно справляющимися с этими задачами. В заключение будут рассмотрены результаты и некоторые ошибки в решениях аналогий разных типов при помощи обеих моделей.

Докладчик: Константин Архипенко.

Презентация: pdf

Видео: https://www.youtube.com/watch?v=Xp6La4pygcs

1. Начинающему разработчику PostgreSQL

  • как устроено сообщество PostgreSQL
  • жизненный цикл разработки новых версий PostgreSQL
  • как написать патч (от Proposal до Commit’a)
  • как ориентироваться в коде

2. Особенности архитектуры PostgreSQL

  • Общая архитектура взаимодействия подсистем
  • Использование глобальных объектов
  • Устройство снимков и реализация MVCC
  • Журналирование
  • Организация репликации, протокол передачи данных между узлами

3. Обзор задач для новичков

Докладчики: Александр Коротков и Анастасия Лубенникова (Postgres Professional)

Начало в 17.00 (среда 23 сентября)

Презентации:

Видео: https://www.youtube.com/watch?v=1n6y-Gdd6PQ

В ходе доклада будут рассмотрены основные подсистемы в СУБД Sedna и механизмы взаимодействия между этими подсистемами. Также будет рассказана эволюция архитектуры и причины, которые подталкивают изменять методы взаимодействия между подсистемами такого рода проектов.

Докладчик: Олег Борисенко

Видео: https://www.youtube.com/watch?v=D23Vw6iRrZQ

Начало в 19.00

TopRater строит систему много-критериального обмена опытом в разных сферах e-commerce. В перспективе мы хотим создать систему обмена оценками и опытом с максимальным уровнем доверия в интернете. Как первый шаг наполнения системы контентом мы разобрали сотни миллионов отзывов в интернете с помощью аспектно-ориентированного анализа сентимента и других методов анализа текстов. В этом докладе будут представлены две технологии компании: аспектно-ориентированный анализ текстов отзывов и собственная система workflow для создания поисковой системы с глубокой версионностью и валидацией данных.

Докладчик: Павел Велихов

Начало в 18.00

Предзащита дипломов 4 и 5 курсов состоится 5 мая в 17.00.

В соответствии с требованиями факультета до 6 мая на кафедру должна быть предоставлена информация о прохождении предзащиты. Студенты не прошедшие предзащиту к защите диплома не допускаются.

Напоминаю, на предзащите студенты должны предоставить печатную версию дипломной работы, подписанную научным руководителем. Неподписанные работы рассматриваться не будут.

Доклад посвящен проекту OpenStack, предназначенному для создания инфраструктурных облачных сервисов и облачных хранилищ. В докладе будут рассмотрены следующие аспекты проекта:

  • Разбор того как устроено сообщество OpenStack
  • OpenStack маркетинг или почему он так популярен
  • Разбор архитектурных ошибок
  • Разбор организационных ошибок
  • Почему из OpenStack-а невозможно сделать продукт

Докладчик: Борис Павлович

Видео: https://www.youtube.com/watch?v=EQETZ9Margc