В докладе рассматриваются специальные способы представления Веб-графа, а также эффективные методы его сжатия, реализованные в библиотеке WebGraph, которые основаны на техниках, применяемых при полнотекстовом индексировании. Данные методы используют особые свойства и эмпирические закономерности, наблюдаемые на веб-графе, и позволяют не только добиться значительного уровня сжатия, но и обеспечить эффективный доступ к графу.
Докладчик: Бартунов Сергей.
Материалы:
- http://vigna.dsi.unimi.it/ftp/papers/WebGraphI.pdf
- http://vigna.dsi.unimi.it/ftp/papers/WebGrahII.pdf
Презентация с семинара (pdf)