Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
17 Декабрь 2011


Cross-domain Sentiment Analysis

Наталья Пономарева

Категория: Осень 2011.

Семинар прошел 17.12.2011

Доклад посвящен проблеме автоматического анализа эмоциональной окраски текста (sentiment analysis) на примере рецензий пользователей о продуктах, взятых с сайта Amazon. Мы поговорим о методах адаптации машинных алгоритмов, обученных на корпусе рецензий об одном продукте, для классификации рецензий о другом продукте (cross-domain sentiment classification). Вначале мы представим линейную модель прогноза потери точности при cross-domain sentiment classification, базирующуюся на двух параметрах: сходстве продуктов (domain similarity) и сложности корпуса рецензий (domain complexity) для классификации эмоциональной окраски текста (sentiment classification). Во второй части доклада будет подробно рассказано об алгоритмах, основанных на графах (graph-based algorithms), и о результатах их применения к проблеме cross-domain sentiment classification.