1. Наука
  2. Видання
  3. Системи обробки інформації
  4. 5(103)'2012
  5. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing

Д. С. Глібов, А. С. Чуприна
Системи обробки інформації. — 2012. — № 5(103). — С. 90-93.
Тематика статті: Інфокомунікаційні системи
УДК 316:303.621.36:004.77
Мова статті: українська
Анотації на мовах:

В статті наводиться опис основних типів алгоритму пошуку запозиченої текстової інформації, представляються результати дослідження алгоритмів TF, LongSent та Winnowing для пошуку нечітких дублікатів в Інтернеті. Особливість пошуку у тому, що алгоритми використовуються окремо для кожного абзацу тексту вхідних документів. Якість роботи алгоритмів розглянуто через метрики: точність, повнота, F-міра.
Ключові слова: дублікат, алгоритм, шингл, подібність
Інформація про авторів публікації:
Бібліографічний опис для цитування:
Глібов Д. С. Пошук запозиченої інформації в Інтернеті, використовуючи алгоритми: TF, LongSent, Winnowing / Д. С. Глібов, А. С. Чуприна  // Системи обробки інформації. — 2012. — № 5. — С. 90-93.