Конференция AINL 2013:
Искусственный Интеллект, Естественный Язык
17-18 мая 2013, Санкт-Петербург

Natural Language Processing (автоматическая обработка естественного языка)

Петр Мицов

(подробнее)

ООО "Центр речевых технологий", Руководитель группы разработки и внедрения систем голосового самообслуживания

Окончил филологический факультет СПбГУ (2001). В аспирантуре занимался изучением структуры русского разговорного диалога. Проектировал мобильные устройства с распознаванием речи (Ectaco), работал ведущим программистом (СПбГУ) и менеджером проектов (T-Systems). В ЦРТ веду проекты по разработке и внедрению IVR систем с распознаванием и синтезом речи.

Тема: Виртуальный помощник с распознаванием и синтезом речи. Проблемы и решения

Секция: Речь

Виртуальный помощник (ВП) сегодня – это мультимодальная система, способная вести с пользователем диалог в режиме «speech-to-speech». Одним из основных критериев эффективности современного ВП является естественность диалога. Естественность диалога напрямую зависит от релевантности ответов ВП на вопросы пользователей. Релевантность, в свою очередь, связана с точностью распознавания речи. В архитектуре системы модуль распознавания речи может использоваться

а) в одностороннем режиме, когда система получает результат распознавания в виде строки текста, или

б) в двустороннем режиме, когда система задает контекстные грамматики и языковые модели, по которым модуль распознавания речи анализирует голосовой ввод. В последнем случае точность распознавания речи может быть значительно повышена.

Проблема

Отсутствие данных для создания грамматик и языковых моделей.

Решение

Анализ записей звонков в контактный центр, анализ поисковых запросов, анализдиалогов с ВП в режиме «text-to-text».

Проблема

Естественность диалога пользователя с ВП существенно ограничивается необходимостью нажимать на кнопку (push-to-talk) при каждом вводе информации.

Решение

Реализация режима распознавания «hotword», при котором система начинает сеанс распознавания, если пользователь произносит определенное слово (например, имя аватара).

Проблема

При озвучивании ответа модуль синтеза речи допускает ошибки на определенной лексике (ударения, аббревиатуры и пр.).

Решение

Предварительная настройка синтеза речи на текстах предметной области.

Проблема

ВП не выражает эмоции и не реагирует на них.

Решение

Поддержка режима синхронизации губ в модуле синтеза речи, использование технологии автоматического анализа эмоций.