Конференция AINL 2013:
Искусственный Интеллект, Естественный Язык
17-18 мая 2013, Санкт-Петербург

Natural Language Processing (автоматическая обработка естественного языка)

Александр Молчанов

(подробнее)

Компания PROMT, руководитель группы статистических исследований

Родился в 1986г. В 2010г. окончил Филологический факультет СПбГУ по специальности «теоретическая и прикладная лингвистика». С 2008г. работаю в компании PROMT в отделе лингвистических разработок. С 2010г. аспирант (кафедра теоретической и прикладной лингвистики Филологического факультета СПбГУ).

Тема: Машинный перевод по правилам и без, или Зачем нужна гибридная технология перевода

Секция: Лингвистические технологии

 

В настоящее время существуют два основных типа систем машинного перевода: основанные на правилах (rule-based, или RB) и статистические. Оба подхода имеют свои преимущества и недостатки. С недавнего времени в мире ведется разработка гибридных технологий машинного перевода, позволяющих совместить сильные стороны двух подходов. Компания PROMT c 2009 года разрабатывает гибридную систему, основанную на внедрении статистических методов в базовую RB-модель перевода. RB-система дополнена двумя компонентами: модулем статистического постредактирования и модулем языковых моделей. Статистическое постредактирование позволяет сгладить RB-перевод, приближаяего к естественному языку и при этом сохраняя четкую структуру синтезируемого текста. Языковые модели используются для оценки гладкости и грамматической правильности вариантов перевода, порождаемых гибридной системой. Статистические методы также широко используются для создания метрик автоматической оценки качества машинного перевода. Большинство современных метрик используют человеческий перевод как эталон и поэтому имеют существенные недостатки (человеческий перевод субъективен и не всегда доступен). В настоящее время компания PROMT проводит собственные исследования в области автоматической оценки машинного перевода.