30 октября на конференции для разработчиков Yet Another Conference компания "Яндекс" представила собственные технологии синтеза речи, выделения смысловых объектов и голосовой активации. Об этом сообщает портал "Цукерберг позвонит".
Протестировать работу технологии под названием Yandex SpeechKit можно с помощью мобильного приложения "Яндекс.Диктовка", доступного для пользователей устройств, работающих на платформе Android. Версия приложения для iOS появится в скором времени.
Yandex SpeechKit поддерживает основные возможные сценарии речевого взаимодействия человека с устройством: голосовую активацию, распознавание речи произвольной тематики и её перевод в текст, синтез речи, а также голосовое управление с выделением смысловых объектов. Так, при помощи мобильного приложения пользователи могут не только надиктовать произвольный текст, но и отдать ряд команд, например, допускаются команды "добавь веселый смайлик", "удали последнее слово", "замени слово "осень" на "весна", "начни с новой строки".
Представители Яндекса также отметили, что технология понимания языка позволяет выделить в распознанном тексте различные объекты, включая дату, время, фамилию или адрес. Кроме того, приложение способно расставить в надиктованном тексте знаки препинания и по команде отправить текст в стороннее приложение. Наконец, с помощью технологии голосовой активации любое приложение может создать собственную голосовую команду активации голосового взаимодействия.
В сообщении, опубликованном в официальном блоге "Яндекса", отмечается, что все элементы технологии были включены в библиотеку SpeechKit Mobile SDK и облачный сервис SpeechKit Cloud и доступны сторонним разработчикам, которые смогут встраивать их в свои продукты: мобильные приложения, игры, компьютерные программы и корпоративные сервисы.