Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts in Аннотации

В одкладе рассматриваются результаты работы Леви и Голдберга, опубликованные в статье O. Levy, Y. Goldberg. Linguistic Regularities in Sparse and Explicit Word Representations, получившей приз за лучшую статью на конференции CoNLL, 2014. В ходе доклада будут рассмотрены две модели представления слов на естественном языке в виде вещественнозначных векторов: на основе нейронных сетей (word2vec), а также […]

1. Начинающему разработчику PostgreSQL как устроено сообщество PostgreSQL жизненный цикл разработки новых версий PostgreSQL как написать патч (от Proposal до Commit’a) как ориентироваться в коде 2. Особенности архитектуры PostgreSQL Общая архитектура взаимодействия подсистем Использование глобальных объектов Устройство снимков и реализация MVCC Журналирование Организация репликации, протокол передачи данных между узлами 3. Обзор задач для новичков Докладчики: […]

В ходе доклада будут рассмотрены основные подсистемы в СУБД Sedna и механизмы взаимодействия между этими подсистемами. Также будет рассказана эволюция архитектуры и причины, которые подталкивают изменять методы взаимодействия между подсистемами такого рода проектов. Докладчик: Олег Борисенко Видео: https://www.youtube.com/watch?v=D23Vw6iRrZQ Начало в 19.00

TopRater строит систему много-критериального обмена опытом в разных сферах e-commerce. В перспективе мы хотим создать систему обмена оценками и опытом с максимальным уровнем доверия в интернете. Как первый шаг наполнения системы контентом мы разобрали сотни миллионов отзывов в интернете с помощью аспектно-ориентированного анализа сентимента и других методов анализа текстов. В этом докладе будут представлены две […]

Доклад посвящен проекту OpenStack, предназначенному для создания инфраструктурных облачных сервисов и облачных хранилищ. В докладе будут рассмотрены следующие аспекты проекта: Разбор того как устроено сообщество OpenStack OpenStack маркетинг или почему он так популярен Разбор архитектурных ошибок Разбор организационных ошибок Почему из OpenStack-а невозможно сделать продукт Докладчик: Борис Павлович Видео: https://www.youtube.com/watch?v=EQETZ9Margc

Онлайновые социальные сети, помимо коммуникационной функции, играют роль хранилищ персональной информации о каждом из пользователей. Сервисы персональной аналитики (Yasiv, TouchGraph, Wolfram|Alpha Personal Analytics и другие) позволяют каждому пользователю анализировать и визуализировать информацию своего аккаунта, а также данные своих соседей в социальном графе. Особый интерес представляет построение и исследование т.н. “эго-сети”, состоящей из пользователя и всех […]

Одним из направлений исследований в отделе Информационных систем ИСП РАН является анализ социальных сетей. Решаются такие задачи, как поиск сообществ, извлечение демографических атрибутов пользователей, объединение аккаунтов пользователей различных социальных сетей, оценка влиятельности пользователей и другие. Доклад посвящен разрабатываемому в отделе фреймворку для обработки социальных данных MOSON, который позволяет реализовать решения упомянутых выше задач в рамках […]

Известно, что один и тот же пользователь может иметь несколько аккаунтов в различных социальных сервисах. Задача объединения таких аккаунтов в единую запись о пользователе актуальна для мобильных устройств и персонализированных сервисов, зависящих от точности пользовательской модели. В докладе будет рассмотрен метод решения этой задачи для случая двух эго-сетей одного пользователя в различных сервисах [1]. Также […]

Этот доклад будет посвящен недавнему проекту с крупным заказчиком. В докладе будет описано, с какими трудностями столкнулась команда, и будет приведен список подводных камней, которые встретились в ходе проекта. Будут затронуты вопросы построения тестовой системы для тестирования, описаны основные возможности тестируемых решений и краткие результаты, полученные в ходе тестирования. Докладчик: Олег Борисенко Видео: http://www.youtube.com/watch?v=gnaOvIiaxQI

Лемматизация (приведение слова к канонической форме) применяется при обработке естественного языка и во многих других областях, которые касаются лингвистики в целом. Методы лемматизации основанные на машинном обучении нуждаются в больших тренировочных данных. Проблема отсутствия аннотированных леммами корпусов для многих языков может быть решена с помощью автоматического построения аннотированных корпусов из коллекции текстов. В ходе доклада […]