Технология Текст в речь в спонтанном стиле, разработанном Лаборатория искусственного интеллекта Сяоми в Китае это один из последних рубежей, когда речь идет о распознавании голоса и использовании устройств с помощью голоса. Проект, который рожденный внутри лаборатория носит название "Владейте моим голосом". Позволяет получателям, которые, к сожалению, страдают от нарушения речи иметь уникальные и персонализированные голоса для общения с другими людьми. Давайте подробно разберемся, что это такое и с каких пор китайская компания над ним работает.
Xiaomi представила свое последнее приложение с передовыми алгоритмами и собственной речевой технологией, которое помогает людям с нарушениями речи.
Xiaomi заботится о людях и стремится удовлетворить их различные потребности с помощью технологических инноваций. За последние несколько лет китайский бренд обнаружил желание многих пользователей с нарушениями речи. владеть своим голосом, даже уникальный, для ежедневного общения. По этой причине Xiaomi создала команду проекта "Владейте моим голосом". Чжу Си, координатор технологического комитета Xiaomi’s Tech for Good, сказал:
Мы рады изучить многочисленные ценности, которые нам предлагают технологические инновации, такие как ответы на запросы пользователей о личной идентичности и построении идентичности.
Чтобы создать наиболее подходящий и персонализированный голос для пользователя с нарушениями речи, команда проекта Xiaomi набрал более 200 волонтеров внутри, чтобы дать свой голос. Алгоритм сопоставления голосовых отпечатков использовался для сопоставления характеристик голосов, предоставленных добровольцами, с характеристиками голоса получателя. Благодаря такому подходу было нашел наиболее подходящий голос в качестве эталонного звука основной голос для получателя.
См. также: Mi Band 7 выходит с большой датой и ценой | Фото
Позже ученые использовали технологию синтеза речи спонтанного стиля для обучить модель искусственного интеллекта. Это позволило к этому новому голосу постепенно добавить естественный ритм и интонацию. правдиво выражать эмоции и тон человека.
Чжу Си добавил:
Если мы заметим и удовлетворим потребности групп меньшинств на ранней стадии, процесс распространения технологии можно будет значительно сократить. Это позволяет сразу же сделать преимущества новых технологий доступными для пользователей с особыми потребностями.
Основой этого проекта является группа специалисты по голосовым технологиям Xiaomi AI Lab. 2017 опубликовали 37 статей на этот счет и присутствовали в важных кругах, таких какМеждународная конференция по акустике, речи и обработке сигналов (ИКАССП). Успех "Владейте моим голосом«В основном это зависит от спонтанного стиля технологии преобразования текста в речь, которую они разработали. Спонтанный стиль технологии Text-To-Speech, по сути, делает синтезированный голос похожим на настоящий человеческий. по его интонации, паузе, темпу и другим характеристикам. Это заменяет монотонное, неестественное ощущение электронного голоса на более естественное.