Российская технология помогла Microsoft совершить “исторический прорыв” в распознавании речи

    Группе исследователей Microsoft в области распознавания речи удалось добиться существенных результатов с помощью методики, разработанной резидентом «Сколково», компанией «ЦРТ-инновации», входящей в группу ЦРТ («Центр речевых технологий»), выяснил CNews.

    На днях Microsoft объявила, что ее система распознавания речи по точности сравнялась с распознаванием речи живым человеком, при этом ошибка распознавания составила всего 5,9%. Такой же результат в аналогичных условиях показали профессиональные стенографисты.

    «Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang).

    Согласно данным научной публикации исследователей из Microsoft, наибольший вклад в улучшение результата внесло использование метода, предложенного ЦРТ на международной конференции Interspeech в сентябре 2016 года в Сан-Франциско.

    Как рассказал изданию руководитель отдела распознавания речи ЦРТ Александр Затворницкий, эта технология применяется как в голосовых помощниках, так и для диктовки, быстрого набора текста с голоса. В корпоративном сегменте распознавание речи активнее всего используется в голосовых IVR (Interactive Voice Response, технология автоматической маршрутизации звонков в колл-центр. – ред.) и в бизнес-анализе».

    На российском рынке, по словам Затворницкого, «ЦРТ-инновации» преуспели в обоих сегментах, для завоевания мирового рынка нужно развивать распознавание других языков помимо русского: «Мы сделали распознавание английского как наиболее распространенного и намерены делать локализацию наших продуктов для него, но также наша стратегия в этом отношении – занять нишу редких языков. Мы первые сделали распознавание казахского, готовое к промышленному внедрению, и распознавание египетского диалекта арабского».

    В настоящее время разработки «ЦРТ-инноваций» активно внедряются в отечественной индустрии. Например, один из продуктов компании, Smart Logger II, позволяет использовать распознавание речи в бизнес-анализе. Его активно используют аналитики контакт-центров (в частности, в “Ростелекоме“) для решения таких задач, как выявление лучших и худших практик в продажах, анализ причин длительных и повторных обращений, анализ причин возникновения претензий, оценка продвижения сервисов самообслуживания, анализ соблюдения операторами скриптов и стандартов обслуживания клиентов, а также выявление причин оттока клиентов.

    На сегодняшний день набор алгоритмов, разработанный учёными группы ЦРТ, занимает третье место в мире по качеству распознавания англоязычной речи в лабораторных условиях. Российские технологии уступают только последним разработкам IBM и Microsoft. Продукты компании внесены в Единый реестр отечественного софта.

    Следите за нашим Телеграм-каналом, чтобы не пропускать самое важное!

    Поделиться: