Posts Tagged ‘Бабаков Александр’

Методы поиска плагиата (15.04.14)

В докладе будет рассказано о проблеме обнаружения плагиата, основных методах модификации, используемых для его сокрытия, а также
о методах и алгоритмах борьбы с ними. Также будут рассмотрены основные методы поиска плагиата, в том числе и современные.

Рассматриваемые методы поиска плагиата: метод «Шинглов» и его модификации, I-Match, метод «Опорных» слов,
метод коэффициента совпадения документов, методы, основанные на использовании внешних поисковых систем.

Литература:
1) Зеленков Ю. Г. и Сегалович И. В. Сравнительный анализ методов определения нечетких дубликатов для Web
2) Potthast Martin Overview of the 4th International Competition on Plagiarism Detection.
3) Barrґon-Cede˜no Alberto и Rosso Paolo On Automatic Plagiarism Detection Based on n-Grams Comparison
4) Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск.
5) Ilyinsky Sergey An efficient method to detect duplicates of Web documents with the use of inverted index.

Докладчик: Бабаков Александр

Система обработки текстов Texterra (13.11.2012)

Texterra — разрабатываемый в ИСП РАН инструмент для обработки и семантического анализа текстов. В ходе доклада будут показаны некоторые возможности системы Texterra. Кроме того будут рассмотрены архитектура и принцип работы системы Texterra, а также один из способов получения базы знаний для нее.

Докладчик: Александр Бабаков

Материалы:

  1. Viktor Ivannikov, Denis Turdakov, Yaroslav Nedumov. Fast Text Annotation with Linked Data.  Eighth International Conference on Computer Science and Information Technologies 26 – 30 September, 2011, Yerevan, Armenia
  2. D. Turdakov. Word sense disambiguation methods. Programming and Computer Software, Vol. 36, Issue 6
  3. M. Grineva, M. Grinev, D. Lizorkin. Extracting Key Terms From Noisy and Multitheme Documents. WWW2009: 18th International World Wide Web Conference

Презентация с семинара