В настоящее время мы переживаем бум социальных интернет-сервисов. Каждый год появляется множество как общенаправленных, так и нишевых социальных сервисов, и для активных пользователей Интернет типично иметь несколько профилей в различных социальных сетях. Обнаружение профилей, принадлежащих одному человеку, в нескольких социальных сетях, позволяет получить более полный социальный граф, что может быть полезно во многих задачах, таких как информационный поиск, интернет-реклама, рекомендательные системы и т.д.

В докладе предлагается оригинальный JLA-метод идентификации пользователей, основанный на модели условных случайных полей (CRF) и активно использующий информацию о социальных связях, что делает его применимым даже в случаях, когда информация о полях пользовательских профилей неполна, недоступна или скрыта из соображений приватности. Эксперименты на данных из двух наиболее популярных в настоящий момент социальных сетей Facebook и Twitter показали, что данный подход работает эффективнее существующих методов и способен сопоставить профили, которые невозможно сопоставить, используя только информацию о полях профилей. В работе также экспериментально демонстрируется, как используя только социальные связи возможно успешно идентифицировать некоторую часть пользователей.

Докладчик: Бартунов Сергей

Материалы:

  • Veldman, I. (2009) Matching Profiles from Social Network Sites. Master’s thesis, University of Twente.
  • Gae-won Y., Seung-won H., Zaiqing N., Ji-Rong W. SocialSearch:Enhancing Entity Search with Social Network Matching. EDBT 2011.

презентация с семинара (pdf)