Корпорация Microsoft продолжает работать над созданием искусственно интеллекта.
Компания уже сделала нейросеть VALL-E, способную подделать голос.
Подробно об этом рассказывается в материале ArsTechnica.
Для создания образца голоса, нейросети хватит всего трехсекундного образца.
Новая нейросеть способна разбить полученный образец аудиозаписи на различные фрагменты.
Затем уже нейросеть сравнивает их с имеющейся базой данной.
ИИ знает, как звучат голоса в разных ситуациях, и предполагает, как именно мог бы звучать предложенный ей голос.
Так у нейросети получается сымитировать правдоподобно голос.
Для создания искусственного интеллекта была использована большая база разных голосов.
В ней содержатся голоса свыше семи тысяч человек.
Общая продолжительность записей в библиотеке нейросети составляет 60 тысяч часов.
В корпорации Microsoft используют такую нейросеть для создания аудиоконтента.
Если ее использовать вместе с генератором текстов GPT-3, то получится создавать полностью оригинальный контент.