Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
15 Декабрь 2007


Автоматическая классификация текстов с использованием латентно-семантического анализа

Алексей Соловьев (Компания “Auditech”)

Категория: Осень 2007

В докладе рассматривается один из методов автоматической классификации и кластеризации текстов – метод латентно-семантического анализа. Это метод факторизации большого объёма данных. Он заключается в выявлении латентных (скрытых) взаимосвязей внутри набора текстов и позволяет определить ассоциативную и семантическую близость лексических единиц (слов или словоформ).

Метод апробирован на материале спонтанной русской речи. Показаны возможные реализации этого метода в зависимости от поставленной задачи.

Обсуждение в кулуарах после доклада: