Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
24 Апрель 2010


Индуктивное моделирование: содержание и примеры применения в задачах обработки текстов

Михаил Александров

 

Категория: Весна 2010.

Индуктивное моделирование (ИМ) позволяет выбрать модель оптимальной сложности из заданного класса моделей для описания ограниченного набора экспериментальных данных. Метод эффективен, когда частично или полностью отсутствует априорная информация о возможной модели объекта. Данный подход был предложен в 80-е годы акад. А.Г. Ивахненко, и ныне ИМ является неотъемлемой частью технологий Machine Learning и Data Mining.

В 1-й части доклада описывается алгоритм ИМ на примере задачи аппроксимации кривой. Рассматриваются две традиционные реализации ИМ – с полным перебором моделей и с селекцией моделей.

Во 2-й части доклада приводятся примеры приложений ИМ к обработке текстов: а) построение формулы подобия слов, обученной на примерах б) количественные оценки в sentiment analysis блогов и диалогов в) определение гранулярности терминологического словаря

В заключении доклада дается информация о научных группах, публикациях и конференциях, связанных с тематикой ИМ.

Ключевые слова: индуктивное моделирование, обработка текстов, внешние критерии качества

 

Материалы по теме:
http://strijov.com/papers/strijov08ln.pdf == Стрижов В.В. Методы индуктивного порождения регрессионных моделей