Управление данными и информационные системы

Научный семинар Института системного программирования РАН

Browsing Posts tagged Борисова Татьяна

Задача тематического моделирования (topic modeling, определение тем текстовых документов) является объектом множества современных исследований. С ростом объемов обрабатываемых данных становится актуальной задача выполнить тематическое моделирование быстро и эффективно. Кроме того, данные могут поступать непрерывным потоком, что требует непрерывного до-обучения алгоритма в процессе работы (online learning). В докладе будут рассмотрены современные алгоритмы тематического моделирования, применяемые к […]

В задачах “обучения с подкреплением” часто возникает необходимость соблюдать баланс между исследованием и использованием  (exploration vs. exploitation trade-off). Здесь исследование — это получение новых знаний о мире путем выполнения действий, которые могут оказаться неоптимальными с точки зрения общего результата, а эксплуатация — выполнение действий, которые являются наилучшими с точки зрения знаний, имеющихся на данный момент. […]

Доклад посвящен методам выбора оптимального набора информативных признаков (feature selection) для задач классификации текстов. Одна из трудностей классификации текстов при помощи машинного обучения состоит в очень большой размерности пространства признаков. Собственное пространство признаков состоит из уникальных термов (слов или фраз), которые встречаются в корпусе документов, и может включать десятки и сотни тысяч термов даже для […]