Семинар: Natural Language Processing
(автоматическая обработка естественного языка)

Natural Language Processing (автоматическая обработка естественного языка)
15 Декабрь 2012


Мастер-класс: инструмент извлечения фактов из текста

Наталья Остапук, Дмитрий Панкратов, Виктор Бочаров (Яндекс)

Категория: Осень 2012.

Томита-парсер – это инструмент для извлечения структурированных данных (фактов) из текста на естественном языке. Извлечение фактов происходит при помощи контекстно-свободных грамматик и словарей ключевых слов. Томита-парсер используется в подготовке данных для различных сервисов Яндекса, таких как Яндекс.Новости или Яндекс.Работа. С 15 декабря 2012 года Томита-парсер доступен и вне Яндекса. На мастер-классе Вы сможете написать свою первую грамматику, запустить ее на текстах написанных на естественном языке и извлечь свои первые факты.

Скачать парсер и ознакомиться с документацией можно по ссылке: api.yandex.ru/tomita