Методы решения задачи исследования/использования (02.12.13)

В задачах «обучения с подкреплением» часто возникает необходимость соблюдать баланс между исследованием и использованием (exploration vs. exploitation trade-off). Здесь исследование — это получение новых знаний о мире путем выполнения действий, которые могут оказаться неоптимальными с точки зрения общего результата, а эксплуатация — выполнение действий, которые являются наилучшими с точки зрения знаний, имеющихся на данный момент. Баланс исследования/использования особенно подробно изучен в задачах о конечных марковских процессах (Markov decision process, MDP) и о многоруком бандите (multi-armed bandit).

В формулировке задачи многорукого бандита за одно действие агент среды может выбирать из конечного множества альтернатив, получая за действие заранее неизвестную награду (reward). Распределение наград среди альтернатив («ручек» бандита) заранее неизвестно. Цель агента — получить как можно большую награду в результате своих действий.

Один из примеров применения задачи исследования/использования — задача показа баннеров рекламы, в которой среди рекламных баннеров нужно выбрать для показа баннер с максимальным CTR (click-through ratio).

В докладе будет рассказано о различных методах решения задачи многорукого бандита, в том числе о методах с доказанными оценками оптимальности, и некоторых эвристических методах.

Докладчик: Татьяна Борисова

Презентация (pdf)

Distance-dependent Chinese Restaurant Process (26.11.13)

Так называемые непараметрические байесовские методы представляют из себя элегантный метод решения проблем контроля сложности и подбора структурных параметров для вероятностных моделей в машинном обучении. Часто применяемые непараметрические распределения вроде процесса Дирихле или процесса индийского буфета предполагают, что моделируемые данные являются симметрично зависимыми (англ. exchangeable), то есть, что порядок, в котором они обрабатываются, не имеет значения. Тем не менее, во многих приложениях, например, в анализе изображений или текстов на естественном языке, данные, как правило, имеют внутренние
зависимости, использование которых может значительно улучшить качество получаемых результатов. ddCRP — относительно новый непараметрический процесс, обобщающий широко применяемый процесс китайского ресторана и позволяющий учитывать произвольные зависимости в данных. В докладе будет подробно рассмотрен ddCRP, различные его свойства, включая недавно открытые и пока не опубликованные, а также возможные приложения.

Докладчик: Сергей Бартунов.

Вычислительная геномика. Задачи. (19.11.13)

Вычислительная геномика — сфера исследований, опирающихся на применение методов вычислительного и статистического анализа для извлечения биологически значимого знания из результатов расшифровки фрагментов генома (цепей ДНК) и связанных с ним молекулярных структур клетки. В настоящее время, когда в биологии накоплена информация о расшифрованных геномах для совершенно разных организмов, по-настоящему актуальным становится вопрос об алгоритмах для автоматического анализа этой информации: в силу больших объёмов данных ручной анализ здесь невозможен. В рамках данного доклада будут рассмотрены некоторые из задач данной сферы исследований, которые наиболее близки тематике семинара.

Докладчик: Илья Филоненко

Отмена семинара

Семинар сегодня, 12.11.13, отменяется.

Просьба сообщить всем заинтересованным лицам.

Using graph partitioning algorithms to improve performance of distributed graph processing (05.11.2013)

One possible way of improving performance of distributed graph processing algorithms is using graph partitioning algorithms. This presentation gives an overview of graph partitioning algorithms and their use. Main ideas for the following algorithms are described: Kernighan-Lin partitioning algorithm, METIS, Balanced Label Propagation.

Speaker: Roman Pastukhov

Presentation

Управление данными и информационные системы

Научный семинар отдела Информационных систем Института системного программирования им. В.П. Иванникова РАН

Archive for Ноябрь, 2013

Методы решения задачи исследования/использования (02.12.13)

Distance-dependent Chinese Restaurant Process (26.11.13)

Вычислительная геномика. Задачи. (19.11.13)

Отмена семинара

Using graph partitioning algorithms to improve performance of distributed graph processing (05.11.2013)