1. Наука
  2. Видання
  3. Системи обробки інформації
  4. 10(135)'2015
  5. Метод векторно-графової кластеризації документів в системах обробки текстової інформації

Метод векторно-графової кластеризації документів в системах обробки текстової інформації

Л.Е. Чала, Ю.Ю. Харитонова
Анотації на мовах:

Статтю присвячено розробці метода кластеризації текстових документів на основі векторного представлення корпуса текстів з використанням графової моделі. Запропонований метод дозволяє здійснювати кластеризацію текстових документів з урахуванням вагових коефіцієнтів окремих слів, які зустрічаються в корпусі. Запропонований метод використовує косинусну міру як відстань між документами та може бути використаний для структурування корпусів текстової інформації великого розміру.
Ключові слова: текстовий документ, векторне уявлення, графова модель, косинусна відстань