На этой страничке собираются ссылки на литературу, полезную для слушателей семинара. Мы разделили все ресурсы на три класса:

  • Минимум к прочтению – в этом разделе собраны ссылки на литературу, необходимую для понимания докладов на семинаре. Советуем ознакомиться всем слушателям.
  • Классические статьи – в данном разделе собраны ссылки на оригинальные и классические статьи, необходимые для понимания истоков.
  • Рекомендуемые книги – здесь собраны книги, рекомендуемые к прочтению. Эти книги не только помогут лучше понимать доклады на семинаре, но и систематизировать знания. Мы не даем ссылки на электронные версии, однако большинство книг можно найти с помощью сервисов Google и ebdb.ru

Общие вопросы

Статьи из этого раздела, содержат ответы на общие вопросы о научно-исследовательской работе, которые задают студенты. Источник – сайт machinelearning.ru.

Минимум к прочтению

  • S. Keshav. How to Read a Paper. (эффективный способ чтения статей) http://ccr.sigcomm.org/online/files/p83-keshavA.pdf
  • Классификация: И.А. Чубукова, “Data Mining”. Лекции 9,10. (HTML)
  • Кластеризация: И.А. Чубукова, “Data Mining”. Лекции 13,14. (HTML)
  • Машинное обучение: Статья информационного ресурса MachineLearning.ru (HTML)
  • David Austin.  How Google Finds Your Needle in the Web’s Haystack (html) (Как считать Google PageRank)
  • Jeffrey Dean and Sanjay Ghemawat. MapReduce: Simplified Data Processing on Large Clusters. (pdf) (Первая статья о MapReduce)
  • Страница с публикациями сотрудников отдела информационных систем ИСП РАН http://ispras.ru/ru/modis/publications.php
  • ACL Wiki for Computational Linguistics, The Association for Computational Linguistics, http://aclweb.org/aclwiki/index.php?title=Main_Page

Классические статьи

  • G. Salton, A. Wong, C. S. Yang. A vector space model for automatic indexing. (pdf(С этой статьи началось использование векторной модели в информационном поиске)
  • Sergey Brin and Lawrence Page. The Anatomy of a Large-Scale Hypertextual Web Search Engine (html) (Первое описание Google)

Рекомендуемые книги

  • Стюарт Рассел, Питер Норвиг, ”Искусственный интеллект: современный подход”. (Лучшая из существующих книг про искусственный интеллект)
  • Кристофер Д. Маннинг, Прабхакар Рагхаван, Хайнрих Шютце, “Введение в информационный поиск” (Хорошая книга для понимания проблем информационного поиска и подходов к их решению)
  • Daniel Jurafsky, James H. Martin. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition (Одна из лучших книг про обработку текстов)
  • Christopher D. Manning, Hinrich Schütze. Foundations of Statistical Natural Language Processing (Книга содержит хорошие примеры применения машинного обучения для обработки текстов)
  • Тоби Сегаран, “Программируем коллективный разум” (Книга про прикладное применение некоторых технологий искусственного интеллекта в Web 2.0 с огромным количеством примеров)
  • Steven Bird, Ewan Klein, and Edward Loper. Natural Language Processing with Python (Книга про обработку текста с помощью библиотеки NLTK для языка Python. Доступна на сайте NLTK)
  • Chuck Lam, Hadoop in Action (Одна из лучших книг про Hadoop)
  • Ian H. Witten, Alistair Moffat, and Timothy C. Bell. Managing Gigabytes. (Классическая книга о хранении и управлении большими объемами данных)