
МОСКВА, 1 ноя — Mediaview. Учёные Томского государственного университета систем управления и радиоэлектроники (ТУСУР) создали новую математическую модель распознавания речи. Разработка превосходит по точности идентификации лучшие мировые аналоги, что в дальнейшем позволит легче управлять «умной» техникой с помощью голоса. Об этом сообщает РИА Новости со ссылкой на Проектный офис «Приоритет 2030» ТУСУР.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», — сказал заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР Антон Конев.
Отмечается, что благодаря улавливанию критических частот погрешность распознавания основного тона речи у российской модели в четыре раза меньше, чем у зарубежных аналогов. Так, новая система позволяет справляться с распознаванием обычной спонтанной речи или пения.
По словам учёных, технология будет способствовать созданию системы продленной идентификации личности. С ее помощью личность собеседника будет идентифицироваться в течение всего сеанса связи — это позволит полностью исключить некоторые типы мошенничества, отмечают исследователи.
В основу разработки легли ранние исследования томских учёных по распознаванию шёпота, проводившиеся с 2018 года.
Ранее Mediaview сообщало, что в ТУСУР разработали технологию передачи данных, которая до 2024 года позволит увеличить эффективность интернета вещей (IoT) вдвое.