Конференция AINL 2013:
Искусственный Интеллект, Естественный Язык
17-18 мая 2013, Санкт-Петербург

Natural Language Processing (автоматическая обработка естественного языка)

Светлана Тимошенко

(подробнее)

Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им А.А. Харкевича Российской Академии Наук, Лаборатория компьютерной лингвистики (Лаборатория №15), Должность: научный сотрудник

Окончила филологический факультет МГУ, выпускница кафедры русского языка. С 2008 года работаю в ИППИ РАН. Научные интересы: семантика, модели естественного языка, онтологии, автоматическая обработка текста.

Тема: Семантический анализ текста на Естественном языке: особенности построения онтологии

Секция: Онтологии

В ИППИ РАН ведется работа по построению онтологии общей тематики, предназначенной для задач семантического анализа текста на естественном языке (ЕЯ). Эта онтология играет двоякую роль: во-первых, она структурирует описываемый мир и фиксирует свойства населяющих его концептов, а во-вторых, служит словарем метаязыка для записи семантических структур. Способы описания концептов, используемые в большинстве существующих онтологий, недостаточно богаты для того, чтобы онтология могла выполнять обе эти функции. В фокусе внимания онтологии обычно находится терминологическая система некоторой предметной области, а не значения, выражаемые в текстах ЕЯ. Язык, будучи системой передачи информации в агрессивной среде, выработал много способов защиты и сжатия информации. В нем имеются механизмы избыточного кодирования информации, развитая система синонимических отношений, шифтеры и механизмы эллипсиса. Мы выработали некоторые приемы адаптации онтологии к семантике ЕЯ. Во-первых, семантика концепта задается его положением в иерархии концептов, совокупностью приписанных ему слотов и их заполнением. Благодаря наследованию свойств сверху вниз по иерархии концептов удается получить достаточно подробное и одновременно компактное описание каждого концепта. Во-вторых, разработан подробный и открытый набор слотов, покрывающий не только лингвистические, но и энциклопедические свойства концептов. Кроме того, он позволяет обойти некоторые проблемы, связанные с монотонным наследованием. В-третьих, в онтологии разрешена синонимия: ряд концептов можно истолковать через другие концепты онтологии.