Конференция AINL 2013:
Искусственный Интеллект, Естественный Язык
17-18 мая 2013, Санкт-Петербург

Natural Language Processing (автоматическая обработка естественного языка)

Анна Власова

(подробнее)

ЗАО "Наносемантика", руководитель лингвистической лаборатории

Закончила филологический факультет МГУ, аспирантуру, кандидат филологических наук. Специалист по внедрению и развитию прикладных лингвистических технологий, автоматизации работы с естественными языками.

В настоящее время - руководитель лингвистической лаборатории в «Ашманов и Партнеры», директор по лингвистическим разработкам в компании «Наносемантика».

Тема: Искусственный интеллект и естественные сложности диалога

Секция: Искусственный Интеллект

 

Компания «Наносемантика» занимается разработкой и внедрением технологий искусственного интеллекта. Одно из направлений работы – искусственные диалоговые системы. Одним из первых подобных проектов, предназначенных для массового рынка, стал «А-я-яй» (iii.ru) – бесплатный сервис, позволяющий создать виртуального человечка - «инфа», обучить его, общаться с ним и, при желании, выставить на стороннем ресурсе.

Основное предназначение инфа – это поддержание диалога с той или иной степенью соответствия разговору на естественном языке. Собеседник-человек ожидает, что инф может распознать письменный текст или звучащую речь, определить язык общения, выделить содержательные части фразы, понять ее общий смысл и связь с разговором имногое другое. Соответствие инфа всем этим ожиданиям обеспечивают лингвистические технологии компании – собственные разработки «Наносемантики».

Одна из первых собственных разработок компании – это формальный языкведения и подготовки данных/баз знаний, он же – язык DL. Он позволяет описать как многочисленные варианты входной фразы собеседника-человека, так и правила выбора/генерации ответов инфа, и обладает широким набором других возможностей.

В докладе будут рассмотрены некоторые типичные лингвистические проблемы автоматизированного анализа и синтеза диалоговых реплик на русском языке, для решения которых используются средства формального языка DL. Например, для анализа текста это проблемы понимания и восстановления опущенной части фразы, распознаваниеи исправление опечаток, удержание «тематического фокуса» диалога и т.п.

В докладе также будут частично затронуты практические проблемы разработки базы знаний инфов для корпоративных задач, т.е. проблемы, связанные с работой в специальной терминологической среде – например, подготовка и ведение терминологических словарей и словарей профессионального жаргона, разрешение омонимии и многозначности, оптимизация диалога с инфом для максимально эффективного решения бизнес-задач.