Ранее в этом месяце Microsoft провела закрытую встречу для сотрудников компании, где продемонстрировала некоторые свои наработки для будущих продуктов и грядущих проектов. На этом видео прототип нового приложения Bing для Windows Phone, на котором демонстрируются улучшения в службе распознания голоса.
Что улучшено в прототипе:
-
повышено качество распознавания, теперь система допускает еще меньше ошибок;
-
сокращено время, требуемое для распознавания, с 1.01 сек. в текущей версии до 0.56 сек. в новой;
-
улучшено распознавание в условиях сильного шумового фона.
В конце видео Эрик Раддер, старший вице-президент корпорации Microsoft по технической стратегии, в беседе с учеными из Microsoft Research упомянул, что в показанном тесте им удалось добиться снижения количества ошибок на 12-15 процентов, но прямо сейчас они могут улучшить результат еще на 10-15 процентов. Таким образом, благодаря новым алгоритмам Глубоких Нейронных Сетей, Microsoft удалось снизить количество ошибок на 10-20%, а также уменьшить на 30% время, требуемое для обработки голоса. Подробнее о Глубоких Нейронных Сетях и системам распознания голоса от Microsoft можно прочитать на официальном блоге Microsoft Research.
На видео презентатор отметил, что определенные усовершенствования уже были выпущены для Windows Phone, однако не ясно, когда всё, что мы увидели поступит в полноценную работу. Напомню, также, что распознание речи, так называемая технология TellMe, у Microsoft используется не только в системных приложениях, таких как Bing, но и доступны всем разработчикам через специальное API. Кроме того, распознание голоса присутствует и в Xbox с Kinect.
Мы надеемся увидеть эти улучшения уже в Windows Phone Blue, однако вероятно, что ждать придется до Windows Phone 9.
Источники: Windows Phone Central и MSFTKitchen.