1. Наука
  2. Видання
  3. Системи обробки інформації
  4. 5(103)'2012
  5. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Д.С. Глібов, А.С. Чуприна
Системи обробки інформації. — 2012. — № 5(103). – С. 90-93.
Тематика статті: Інфокомунікаційні системи
УДК 316:303.621.36:004.77
Мова статті: українська
Анотації на мовах:

В статті наводиться опис основних типів алгоритму пошуку запозиченої текстової інформації, представляються результати дослідження алгоритмів TF, LongSent та Winnowing для пошуку нечітких дублікатів в Інтернеті. Особливість пошуку у тому, що алгоритми використовуються окремо для кожного абзацу тексту вхідних документів. Якість роботи алгоритмів розглянуто через метрики: точність, повнота, F-міра.
Ключові слова: дублікат, алгоритм, шингл, подібність
Інформація про авторів публікації:
Бібліографічний опис для цитування:
Глібов Д.С. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing / Д.С. Глібов, А.С. Чуприна  // Системи обробки інформації. – 2012. – № 5(103). – С. 90-93.