Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
23 Октябрь 2010


Текстуальные связи в газете

Шайкевич Анатолий Янович (Институт русского языка РАН, Москва)

Категория: Осень 2010.

Дистрибутивно-статистический анализ текстов (ДСАТ)применяется к газетным текстам “The Times” (1995) [футбол и экономика] и «Независимой газеты» (1996–2000) [политика]. ДСАТ основан на последовательном сравнении математического ожидания совместной встречаемости пар слов с их реальной встречаемостью. Получаемые количественные показатели называются текстуальными связями слов. Сети текстуальных связей варьируют в разных подкорпусах газет и могут стать базой для построения соответствующих семантических словарей.