1. Наука
  2. Видання
  3. Системи обробки інформації
  4. 2(92)'2011
  5. Класифікація текстових фрагментів слабоструктурованих текстових документів як атрибут даних або як значення атрибуту даних

Класифікація текстових фрагментів слабоструктурованих текстових документів як атрибут даних або як значення атрибуту даних

В.О. Губін, Ю.Ю. Шевякова
Анотації на мовах:

Запропонований підхід, що дозволяє віднести той або інший відособлений текстовий фрагмент слабоструктурованого текстового документа до атрибуту даних або до значення атрибуту даних. При цьому передбачається, що аналізується сукупність слабоструктурованих текстових документів одного вигляду. Даний підхід заснований на зіставленні абсолютних частот тієї, що зустрічається текстових фрагментів в сукупності документів.
Ключові слова: слабоструктурований документ, дані, атрибут даних, значення даних