Создана офлайн-система распознавания речи с точностью почти в 100 % | Quokka marketing teсhnologies - все о разработке, интернет рекламе и пиаре

Совершен настоящий прорыв в области IT-технологий – потрясающие результаты получены благодаря современным алгоритмам нейросетей

Привычным системам распознавания речи или лиц для работы необходим интернет. Разработчики всего мира долго бились над тем, чтобы сделать доступными эти средства без использования огромных серверных мощностей. Потрясающих результатов помогли добиться современные алгоритмы нейросетей. Недавно Microsoft и Google предложили свои независящие от интернета переводчики на основе нейросетей. Что ж, теперь дело за алгоритмами распознавания голоса.

Новая разработка принадлежит команде исследователей из Университета Ватерлоо и стартапу под названием DarwinAI. Их технология получила название EdgeSpeechNets.

Первым этапом их работы стало создание прототипа. Его недостатком оказался ограниченный словарный запас. При этом он отлично распознавал целые фразы из достаточно быстрого потока речи. Полученные данные были преобразованы в математическую формулу, которую в дальнейшем использовали для проектирования нейросети с высокой производительностью.

Для испытаний получившейся программы разработчики использовали хранилище Google Speech Commands, которое содержит 65000 1-секундных звуковых образцов. В итоге версия системы EdgeSpeechNet-D показала великолепный результат: точность в 97% на довольно слабом смартфоне Motorola Moto E c процессором 1,4 ГГц.

Вконтакте

facebook

twitter

Класснуть

Плюсануть

Читать еще: