Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
19 Май 2012


Анализ текста на естественном языке, управляемый вариантами разбора

Алексей Носков

Категория: Весна 2012.

Семинар прошел 19.05.2012

Общепринятой схемой обработки теста на естественном языке (ЕЯ) является последовательность независимых этапов его анализа на основных уровнях, включая графематический, морфологический и синтаксический анализ. На каждом этапе в общем случае возникают многочисленные варианты разбора отдельных единиц текста, окончательный выбор между которыми часто может быть сделан только на последующих этапах, что представляет одну из сложностей обработки ЕЯ и приводит к появлению промежуточных этапов, таких как постморфология. В докладе рассматривается подход к обработке текстов на ЕЯ, в рамках которого варианты разбора, возникающие на основных этапах анализа, обрабатываются последовательно, а сами этапы анализа выполняются одновременно. Подход иллюстрируется реализацией поверхностно-синтаксического анализа текста по лингвистическим шаблонам, подобным шаблонам языка LSPL ( www.lspl.ru ) и языка JAPE (системы GATE: www.gate.ac.uk ).