Российская технология сегментирования аудиопотока и распознавания речи, созданная группой компаний ЦРТ, признана лучшей на международном конкурсе CHiME Speech Separation and Recognition Challenge (CHiME-6).
Распознавание спонтанной речи нескольких дикторов в условиях частичного наложения речи и шума, например, общения на вечеринке, стало предметом конкурса.
Впервые в истории конкурсантам было предложено решить проблему с несегментированной речью, с перекрытием речи до 20%.
Записи для конкурса были сделаны на 20 ужинах в настоящих домах, где люди свободно общались, шутили, смеялись, готовили, ели, мыли посуду.
Организаторы поставили перед участниками цель — создать систему распознавания, которая прослушает записи и выдаст полную расшифровку с наименьшим количеством ошибок. В итоге победителем стала технология, созданная специалистами ЦРТ.
"Качественное распознавание речи разных дикторов, при этом перебиваемой шумами, позволяет выводить сервисы из разряда инновационных в повседневное применение, совершенствуя бизнес и упрощая нашу жизнь", — отметил генеральный директор группы компаний ЦРТ Дмитрий Дырмовский.
В начале января президент России Владимир Путин в ходе обращения с ежегодным посланием к Федеральному собранию заявил, что страна способна достичь прорыва в сфере развития искусственного интеллекта.
В ноябре прошлого года Сбербанк создал самый мощный в России суперкомпьютер. Данная модель помогает ускорить разработку сервисов и процессов, основанных на искусственном интеллекте.