В докладе освещены шаблоны проектирования распределенных программ в модели MapReduce. В частности уделяется особое внимание разработке для фреймворка Apache Hadoop. Будут рассмотрены проблемы хранения промежуточных данных, сортировки пар ключ-значение по значению(secondary sorting), очередности вычисления данных(например, при вычислении числителя, знаменателя и их отношения).
Докладчик: Алексей Сильвестров
Материалы:
- Jimmy Lin and Chris Dyer. Data-Intensive Text Processing with MapReduce. (1-3 главы)
презентация с семинара (ppt)
Comments are closed.