1. Наука
  2. Видання
  3. Системи обробки інформації
  4. 5(103)'2012
  5. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Д.С. Глібов, А.С. Чуприна
Системи обробки інформації. — 2012. — № 5(103). С. 90-93.
Тематика статті: Інфокомунікаційні системи
УДК 316:303.621.36:004.77
Мова статті: українська
Анотації на мовах:


Анотація: В статті наводиться опис основних типів алгоритму пошуку запозиченої текстової інформації, представляються результати дослідження алгоритмів TF, LongSent та Winnowing для пошуку нечітких дублікатів в Інтернеті. Особливість пошуку у тому, що алгоритми використовуються окремо для кожного абзацу тексту вхідних документів. Якість роботи алгоритмів розглянуто через метрики: точність, повнота, F-міра.


Ключові слова: дублікат, алгоритм, шингл, подібність
Інформація про авторів публікації:
Бібліографічний опис для цитування:
Глібов Д.С., Чуприна А.С. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing. Системи обробки інформації. 2012. № 5(103). С. 90-93.