Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
16 Ноябрь 2010


ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ

Дмитрий Ландэ, Владлен Жигало (Информационный центр «ЭЛВИСТИ», Киев, Украина)

Категория: Осень 2010.

При создании статистических переводчиков с близких по структуре языков (например, русско-украинского) решается ряд задач, имеющих важное значение для таких приложений, как автоматическое выявление опорных (ключевых) слов в документах, выявление дубликатов документов (плагиата), представленных на различных языках, построение корпусов параллельных текстовых документов, предложений, n-грамм, и, наконец, создания автоматических переводчиков.
В докладе описана методология создания «самообучаемого» статистического переводчика, ориентированного на массовый перевод текстовой информации из информационных потоков.