Совершен настоящий прорыв в области IT-технологий – потрясающие результаты получены благодаря современным алгоритмам нейросетей

Привычным системам распознавания речи или лиц для работы необходим интернет. Разработчики всего мира долго бились над тем, чтобы сделать доступными эти средства без использования огромных серверных мощностей. Потрясающих результатов помогли добиться современные алгоритмы нейросетей. Недавно Microsoft и Google предложили свои независящие от интернета переводчики на основе нейросетей. Что ж, теперь дело за алгоритмами распознавания голоса.

Новая разработка принадлежит команде исследователей из Университета Ватерлоо и стартапу под названием DarwinAI. Их технология получила название EdgeSpeechNets.

системам распознавания речи

Первым этапом их работы стало создание прототипа. Его недостатком оказался ограниченный словарный запас. При этом он отлично распознавал целые фразы из достаточно быстрого потока речи. Полученные данные были преобразованы в математическую формулу, которую в дальнейшем использовали для проектирования нейросети с высокой производительностью.

Для испытаний получившейся программы разработчики использовали хранилище Google Speech Commands, которое содержит 65000 1-секундных звуковых образцов. В итоге версия системы EdgeSpeechNet-D показала великолепный результат: точность в 97% на довольно слабом смартфоне Motorola Moto E c процессором 1,4 ГГц.