Новое поколение систем распознавания речи

Data Science
Зал №6

В последние годы распознавание и синтез речи у всех на слуху. Многие пользуются голосовым вводом в телефоне и часто сталкиваются с некорректными результатами, берущими начало в применённой технологии и алгоритмах. Многие компании заявляют о создании своих движков с самыми замечательными характеристиками. В этой ситуации разработчикам тяжело выбрать правильную технологию, оценить возможность и трудоёмкость реализации распознавания в собственных приложениях.

В докладе я расскажу о том, как легко определить поколение системы распознавания речи, как оценить усилия по самостоятельной разработке речевого модуля и как работает система распознавания нового поколения.

Запись доклада

Презентация

АЦ Технологии

Николай Шмырёв

С 2003 года занимаюсь речью, создал первый русский голос для синтезатора речи Festival, более 10 лет поддерживаю популярную речевую библиотеку [CMUSphinx], участвую в различных проектах по внедрению речевых технологий.

С 2003 года занимаюсь речью, создал первый русский голос для синтезатора речи Festival, более 10 лет поддерживаю популярную речевую библиотеку [CMUSphinx], участвую в различных проектах по внедрению речевых технологий.