Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts in Аннотации

В последние несколько лет количество различных СУБД с разными языками запросов и моделями данных стремительно выросло. Даже при наличие стандартов, таких как SQL, очень много функционала в стандарты не попадает (например различные библиотеки функций и расширения языка), таким образом каждая СУБД с поддержкой SQL на самом деле предлагает свой особый диалект. При этом, возможности программистов, […]

2 мая – предзащита 4 курса бакалавриата и 2 года магистратуры ВМК МГУ 24 мая (дата перенесена) – Защита курсовых 3 курса бакалавриата и 1 года магистратуры ВМК МГУ

Для тестирования значимости или масштабируемости алгоритмов анализа сетей (например, поиска сообществ в графе) необходимо иметь датасет из разных графов разного размера. Однако, обычно в наличии есть небольшое количество реальных графов, а кроме того, их свойства могут сильно различаться в зависимости от домена: социальные графы, графы звонков, биологические и т.д. Поэтому необходимо уметь генерить случайные графы […]

Кластеризация текстовых документов, то есть разбиение множества документов на близкие по смыслу подмножества, является фундаментальной задачей обработки текстов. Ее результаты используются во многих прикладных задачах (таких как информационный поиск, исследовательский поиск, определение спама). Данный доклад посвящен обзору и экспериментальному сравнению методов кластеризации текстовых документов в приложении к научным статьям. В ходе доклада будут рассмотрены методы, […]

Социальный граф содержит много информации о пользователях социальных сетей и может быть использован для определения демографических атрибутов, определения основного мест проживания и выявления ботов. Однако использование графа затруднено т.к. большинство алгоритмов классификации и регрессии не способны работать с графом непосредственно. Для того, чтобы использовать стандартные методы машинного обучения можно представить вершины графа в виде векторов […]

Доклад посвящен определению основного места проживания пользователей социальных сетей. Будет рассказано про подходы, основанные на анализе социального графа – вероятностные модели, метод распространения меток, и подход основывающийся на graph node embeddings и алгоритмах машинного обучения. Докладчик: Юлия Трофимович

Пользователи сети Интернет, взаимодействующие в социальных медиа, как правило, имеют публичные страницы, на которых они могут указывать персональную информацию, включая социо-демографические характеристики. К таким характеристикам относятся пол, возраст,семейное положение, уровень образования, профессия, трудоустроенность, национальность, место жительства и другие. Социо-демографический профиль пользователя — набор значений его социо-демографических атрибутов. По тем или иным причинам далеко не все атрибуты заполняются пользователями. […]

Проблема распознавания достоверности новостей является актуальной, особенно в настоящее время, в гетерогенном информационном поле. Поэтому необходимо разработать инструменты, которые позволили бы автоматически с использованием лингвистических методов и моделей определять достоверность или недостоверность новостей, опубликованных в интернет-СМИ. На уровне дискурса в области автоматической обработки текста можно работать с текстами в рамках теории риторической структуры. Мы собрали […]

Автоматическое извлечение терминологии используется для решения многих задач, связанных с обработкой текстов предметной области. Однако существующие методы, как правило, показывают точность и полноту недостаточные для применения на практике. Более того, до сих пор отсутствует надежное экспериментальное сравнение разработанных методов. Одна из причин заключается в сложности реализации этих методов. В докладе будет рассказно об открытой реализации […]

В докладе планируется рассказать про решение конкурса по определению парафраза. Будут рассказаны типичные признаки для этой задачи и методы, позволяющие их эффективно использовать (в частности многослойный персептрон и “сиамские” нейронные сети). Докладчик: Кирилл Скорняков Внимание! Семинар состоится в четверг 27 октября. Начало в 18.00.