Задача тематического моделирования (topic modeling, определение тем текстовых документов) является объектом множества современных исследований. С ростом объемов обрабатываемых данных становится актуальной задача выполнить тематическое моделирование быстро и эффективно. Кроме того, данные могут поступать непрерывным потоком, что требует непрерывного до-обучения алгоритма в процессе работы (online learning).
В докладе будут рассмотрены современные алгоритмы тематического моделирования, применяемые к большим коллекциям текстовых документов. Особый упор будет сделан на аспекты реализации таких алгоритмов в распределенных системах.
Докладчик: Татьяна Борисова
Презентация: Doklad_21_oktyabrya_4
Comments are closed.