Поиск угроз информационной безопасности (23.04.2019)

Обеспечение информационной безопасности организации уже давно вышло за пределы просто процесса настройки межсетевого экрана и написания политики безопасности. Понимание принципов работы злоумышленников, знание техник и процедур, а также прогнозирование актуальных угроз информационной безопасности может сильно увеличить возможности успешного противостояния нарушителям.

Будут даны определения угроз и уязвимостей информационной безопасности, способы и мировые стандарты описания, хранения и обмена угрозами и уязвимостями ИБ, рассмотрены основные участники (акторы) процессов выявления угроз и уязвимостей ИБ, их функции, платформы обработки и анализа данных (платформы Threat Intelligence. Будут рассмотрены подходы к прогнозированию угроз информационной безопасности (существующие методики и разрабатываемые теоретические подходы).

Докладчик: Евгений Бечкало

 

Просеминар на ВМК

20 марта в 14:35 в аудитории 507 Денис Турдаков и Ярослав Недумов расскажут про направления работы на спецсеминаре «Управление данными и информационные системы» кафедры СП.

Приглашаются студенты 2 курса, выбирающие, на какую кафедру пойти.

Задача классификации контекстов цитирований (15.01.2019)

Подсчёт количества цитирований является одним из основных показателей при расчете метрик для оценки значимости исследования. К примеру, индекс Хирша, который является популярной метрикой для оценки деятельности исследователей основан именно на количестве цитирований. Однако, никак не учитывается вес цитирований. Аналогично, на графе цитирования все цитирования обычно обозначаются одинаковыми рёбрами от одной статьи к другой. Во внимание принимаются вопросы о том, какие работы цитируют учёные, кто автор данных работ, однако не рассматривается такой важный аспект, как причина цитирования. В то время как цитирования могут нести разную смысловую нагрузку, в том числе и негативную.

В докладе будут рассмотрены причины цитирований, представлены результаты по построению классификатора для автоматического определения цели цитирования.

Доклад состоится 15.01.19 в 18.00

Докладчик: Семина Наталья

Построение диалоговых систем (04.12.2018)

Построение диалоговых систем (чат-ботов) является одной из самых актуальных задач natural language processing. В последние годы получено большое количество теоретических и практических результатов в данной области. К практическим результатам можно отнести создание таких систем, как Amazon Alexa, Yandex Alisa  и т.д, теоретические результаты регулярно публикуются в рамках основного и competition треков крупнейших конференций по машинному обучению (хороший обзор полученных теоретических результатов есть в https://www.kdd.org/exploration_files/19-2-Article3.pdf).
На докладе будет дан обзор современного состояния теории построения диалоговых систем, рассказаны основные подходы к построению goal-oriented и chit-chat ботов, теоретические результаты и фреймворки для построения чат-ботов. Будут представлены практические результаты, полученные в рамках участия в хакатоне deephack 2018.
Докладчик: Александр Никитин
Презентация: pdf

Сквозное кэширование JSON и TPC-H для Apache Ignite

13 ноября (вторник) в 18:00 будет проведен семинар, посвященный реализации операций над JSON-данными через JDBC в режиме сквозного кэширования над PostgreSQL. Также будет рассказано о бенчмарке TPC-H и сравнении Apache Ignite, VoltDB и PostgreSQL.

Докладчики: Никита Лазарев и Давид Бадалян.

 

Приходите.

(UPDATED) Курсовые и выпускные работы студентов семинара на 2018/2019 учебный год

Распределением тем по студентам закончено, итоговая таблица опубликована ниже. Для уточнения дальнейших планов свяжитесь со своим научным руководителем.

Курс ВУЗ ФИО Фамилия руководителя
Направление работы
3 ВМК Бурков Никита Анатольевич Рындин (Скорняков)
Исследовние и разработка методов выделения и предобработки текстов на изображениях
3 ВМК Зимнюков Максим Олегович Дробышевский
Исследование свойств динамических графов
3 ВМК Клочко Андрей Андреевич Яцков
Сбор данных (уточняется)
3 ВМК Муинова Анастасия Муинжоновна Архипенко
Исследование влияния неформального языка на эмоциональную окраску текстов
3 ВМК Пеганова Ирина Олеговна Недумов
Суммаризация аннотаций научных статей
3 ВМК Самохина Анна Романовна Недумов
Контекстно-зависимая рекомендация цитирований в научных статьях
4 ВМК Аветисян Арам Арутюнович Турдаков
Исследование и разработка методов оценки популярности информационных сюжетов на ранних стадиях
4 ВМК Кравченко Егор Викторович Архипенко
Выявление иронии для анализа тональности по отношению к NE (уточняется)
4 ВМК Миронов Артем Владимирович Варламов
Методы извлечения структуры из полуструктурированных текстов (уточняется)
4 ВМК Николаева Айталина Владимировна Андрианов
Методы переноса знаний о синтаксической структуре в задаче извлечения отношений
4 ВМК Раснюк Александр Геннадьевич Архипенко
Методы глубокого активного обучения алгоритмов обработки текстов
4 ВМК Трифонов Владислав Дмитриевич Андрианов
Методы извлечения отношений с частичным привлечением учителя
4 МФТИ Бойко Александр Михайлович Архипенко
Multi-task learning for NLP (уточняется)
4 МФТИ Великанов Олег Тапехин
Сравнительный анализ алгоритмов консенсуса в недоверенных сетях
4 МФТИ Гусева Дарья Скорняков
Граф эмбединг + адаптация к домену
4 МФТИ Дяченко Татьяна Владимировна Варламов
Сбор данных из форумов
4 МФТИ Жибоедова Анастасия Андреевна Яцков
Поиск PDF-документов научных статей в Вебе
4 МФТИ Кузнецов Мирон Дмитриевич Яцков
Автоматические построение новостного потока для сайтов СМИ
4 МФТИ Лоик Анна Валерьевна Недумов
Кластеризация коллекций научных статей
5 ВМК Барашко Владимир Тапехин
Достижение консенсуса в недоверенной сети в распределенных базах данных
5 ВМК Портной Александр Михайлович Дробышевский
Сравнение методов генерации графов, похожих на данный
5 ВМК Строев Вячеслав Игоревич Андрианов
Методы извлечения отношений (мета-тема)
5 ВШЭ Аникин Дмитрий Сергеевич Недумов
Исследование методов повышения производительности графовых баз данных
5 ВШЭ Бардуков Анатолий Дробышевский
Блокчейн (уточняется)
5 ВШЭ Беляева Дарья Скорняков
Граф эмбединг и адаптация к домену
5 ВШЭ Ломотин Константин Евгеньевич Рындин (Скорняков)
Адаптация к домену в задаче распознавания текстов
6 ВМК Варламова Арина Олеговна Трофимович
Активное обучение при разметке корпуса несколькими аннотаторами
6 ВМК Иконникова Мария Кирилловна Андрианов
Методы выявления именных групп
6 ВМК Лазарев Никита Алексеевич Борисенко
(пока неточная формулировка) Исследование и реализация исполнения запросов к JSON данным в распределенной СУБД в оперативной памяти
6 ВШЭ Борисов Павел Геннадьевич Борисенко
(пока неточная формулировка) Реализация облачной среды для экосистемы XenServer
6 МФТИ Рындин Максим Алексеевич Турдаков
Онлайновая инкрементная полуконтролируемая настройка текстовых классификаторов
6 МФТИ Сёмина Наталья Викторовна Недумов
Классификация типов цитирований научных статей
6 МФТИ Швецова Валерия Валерьевна Борисенко
(пока неточная формулировка) DSL для поднятия сложных сервисов в облаках

Если вы не нашли себя в таблице, свяжитесь с научным руководителем. Если вы не знаете своего научного руководителя, свяжитесь со мной: yaroslav.nedumov@ispras.ru.

Курсовые и выпускные работы студентов семинара на 2018/2019 учебный год

По итогам поступивших анкет и заявок от научных руководителей сформирована таблица с распределением студентов по научным руководителям и направлениям. Поздравляем!

Курс ВУЗ ФИО Фамилия руководителя Направление работы
3 ВМК Пеганова Ирина Олеговна Недумов Суммаризация аннотаций научных статей
4 МФТИ Лоик Анна Валерьевна Недумов Кластеризация коллекций научных статей
4 МФТИ Гусева Дарья Скорняков Граф эмбединг + адаптация к домену
4 МФТИ Великанов Олег Тапехин
Сравнительный анализ алгоритмов консенсуса в недоверенных сетях
4 МФТИ Кузнецов Мирон Дмитриевич Яцков
Автоматические построение новостного потока для сайтов СМИ
4 МФТИ Жибоедова Анастасия Андреевна Яцков
Поиск PDF-документов научных статей в Вебе
4 МФТИ Дяченко Татьяна Владимировна Варламов Сбор данных из форумов
5 ВМК Барашко Владимир Дробышевский ColorChain возможно
5 ВМК Портной Александр Михайлович Тапехин
Достижение консенсуса в недоверенной сети в распределенных базах данных
5 ВШЭ Аникин Дмитрий Сергеевич Недумов
Исследование методов повышения производительности графовых баз данных
5 ВШЭ Бардуков Анатолий Дробышевский Свой стартап по блокчейн
5 ВШЭ Беляева Дарья Скорняков Граф эмбединг и адаптация к домену
6 ВМК Варламова Арина Олеговна Трофимович
Активное обучение при разметке корпуса несколькими аннотаторами
6 МФТИ Сёмина Наталья Викторовна Недумов
Классификация типов цитирований научных статей

Студенты из второй таблицы продолжают работу со своими научными руководителями, но должны выяснить у них свои темы.

Курс ВУЗ ФИО
Фамилия руководителя
4 ВМК Аветисян Арам Арутюнович Турдаков
4 ВМК Кравченко Егор Викторович Архипенко
4 ВМК Раснюк Александр Геннадьевич Архипенко
4 ВМК Трифонов Владислав Дмитриевич Андрианов
5 ВМК Аксенов Михаил Владимирович Андрианов
5 ВМК Аксенова Елена Леонидовна Борисенко
5 ВМК Жаботинский Андрей Андреевич Скорняков
5 ВМК Строев Вячеслав Игоревич Андрианов
6 ВШЭ Борисов Павел Геннадьевич Борисенко
6 МФТИ Рындин Максим Алексеевич Турдаков
6 МФТИ Швецова Валерия Валерьевна Борисенко
6 ВМК Лазарев Никита Алексеевич Борисенко
6 МФТИ Зыков Никита Викторович Лагута

Анкета Ломотина Константина Евгеньевича поступила с опозданием, но будет обработана в ближайшие дни.

Если вы не нашли себя ни в одной из таблиц, но у вас была договоренность с научным руководителем о теме до 1 октября: напишите своему научному руководителю, чтобы он со мной связался.

Остальные должны отправить объяснительную, почему они не заполнили форму вовремя, на почту yaroslav.nedumov@ispras.ru. И заполнить форму. Вопрос с распределением будет решаться в индивидуальном порядке.

Распределение тем на 2018/2019 учебный год

Внимание! 24.09.2018 (понедельник) в 18:00 состоится презентация тем курсовых и дипломных работ. Предварительный список тем можно найти уже сейчас на страницах научных руководителей.

Приглашаются студенты ВМК МГУ, МФТИ и ВШЭ.

Распределение тем на спецсеминаре происходит по обобщенному алгоритму Гейла-Шепли. Механика процесса следующая:

  1. В понедельник вечером мы рассказываем о своих направлениях исследований и темах работ.
  2. После семинара и далее в течение недели, до пятницы 28 сентября включительно, можно договориться с потенциальным научным руководителем, встретиться и обсудить темы более подробно.
  3. К 6 часам утра понедельника 1 октября каждый студент, у которого еще нет твердой договоренности с научным руководителем, должен заполнить гуглоформу с его предпочтениями по темам (ссылка появится здесь после презентации тем).
  4. В течение понедельника-вторника мы определимся со своими предпочтениями и к следующему семинару (19:00, 2 октября) здесь, на сайте семинара, будет опубликовано распределение по темам.

Исследовательский поиск научных публикаций (17.04.2018)

Современные поисковые системы хорошо подходят для поиска единичных фактов, конкретных документов, ответов на вопросы. Однако не всегда поисковые потребности пользователей так конкретны. Пользователь может точно не знать, что именно он хочет найти, может не понимать, пора ли закончить поиск или следует продолжать, анализ результатов поиска может требовать значительного времени. В таких случаях говорят о задаче исследовательского поиска (exploratory search). Эффективное решение задачи исследовательского поиска требует применения специфических инструментов, зачастую зависящих от домена. Интуитивно понятно, что поиск научных данных во многих случаях является исследовательским. Поиск в этом домене с одной стороны сталкивается с вызовами: сложность языка текстов, специфическая терминология, а с другой стороны, кроме текстов статей можно использовать метаданные (время и место публикации, авторов) и граф цитирования.

В докладе будут рассмотрены варианты постановки задачи исследовательского поиска, рассмотрены поисковые потребности ученых и формализована их связь с задачей исследовательского поиска. Будут рассмотрены инструменты исследовательского поиска и их реализации в современных системах поиска публикаций.

Доклад состоится 17.04.2018 в 18:00 в 110 комнате ИСП РАН.

Докладчик: Ярослав Недумов