Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts in Аннотации

Пользователи сети Интернет, взаимодействующие в социальных медиа, как правило, имеют публичные страницы, на которых они могут указывать персональную информацию, включая социо-демографические характеристики. К таким характеристикам относятся пол, возраст,семейное положение, уровень образования, профессия, трудоустроенность, национальность, место жительства и другие. Социо-демографический профиль пользователя — набор значений его социо-демографических атрибутов. По тем или иным причинам далеко не все атрибуты заполняются пользователями. […]

Проблема распознавания достоверности новостей является актуальной, особенно в настоящее время, в гетерогенном информационном поле. Поэтому необходимо разработать инструменты, которые позволили бы автоматически с использованием лингвистических методов и моделей определять достоверность или недостоверность новостей, опубликованных в интернет-СМИ. На уровне дискурса в области автоматической обработки текста можно работать с текстами в рамках теории риторической структуры. Мы собрали […]

Автоматическое извлечение терминологии используется для решения многих задач, связанных с обработкой текстов предметной области. Однако существующие методы, как правило, показывают точность и полноту недостаточные для применения на практике. Более того, до сих пор отсутствует надежное экспериментальное сравнение разработанных методов. Одна из причин заключается в сложности реализации этих методов. В докладе будет рассказно об открытой реализации […]

В докладе планируется рассказать про решение конкурса по определению парафраза. Будут рассказаны типичные признаки для этой задачи и методы, позволяющие их эффективно использовать (в частности многослойный персептрон и “сиамские” нейронные сети). Докладчик: Кирилл Скорняков Внимание! Семинар состоится в четверг 27 октября. Начало в 18.00.

Задача выявления дубликатов это поиск разных версии одного и того же изображения, изображения которые не являются точными копиями на бинарном уровне, но могут быть визуально идентифицированы как одни и те же изображения повергшиеся различным трансформациям (масштабирование, смена точки съема…). Для выявления пар дубликатов был применен подход глубинного обучения. Для входной пары изображений вычисляются свойства (features) […]

Сегодня на семинаре будет продемонстрирована альфа-версия системы поддержки проведения исследований ReCol/SciGraph. Докладчик: Ярослав Недумов

Берюхов Андрей, ВШЭ, 3 – Варламов, Разработка системы извлечения информации из веб-страниц по размеченным примерам Баранов Антон, ВШЭ, 3 – Чихрадзе, Анализ динамических свойств сообществ Егоров Николай, ВШЭ, 3 – Гомзин, Определение зависимых демографических атрибутов пользователей сети Интернет Репина Анастасия, ВШЭ, 3 – Андрианов, Построение множества (иерархии) категорий аспектов предметной области по отзывам Урнышев Евгений, […]

Семинар 04.10.2016 отменен по просьбе докладчика. Следующий семинар состоится во вторник 11.10.2016.

На семинаре 27 сентября 2016 состоится сбор по поводу распределения тем курсовых и знакомства студентов с их руководителями (если еще не знакомы). Начало в 19:00 в 110 комнате (в ИСП РАН). UPDATE: Каждый студент спецсеминара должен прислать минимум 3 темы в порядке убывания приоритета на адрес yaroslav.nedumov@ispras.ru UPDATE2: И не забывайте написать как вас зовут, […]

Доклад является продолжением осеннего доклада про задачу сопоставления сущностей. В этой части будет кратко рассказано об активном обучении (active learning) вообще и о его применении к задаче сопоставления сущностей. Активное обучение – подобласть исследований в рамках машинного обучения, объединяющая методы активного выбора точек для добавления в обучающий набор. Из-за высокой зависимости задачи сопоставления сущностей от […]