Мы используем файлы cookie на этом сайте, чтобы улучшить ваш пользовательский опыт.
Пожалуйста, ознакомьтесь с Политикой конфиденциальности для получения более подробной информации.

Революционный подход для синтеза речи по тексту
20.06.2024

👉 Microsoft представляет революционный подход для синтеза речи по тексту.

🗣 Это языковая модель нейронного кодека (VALL-E), которая использует дискретные коды, полученные из стандартной модели нейронного аудиокодака.

🎓VALL-E создает возможности обучения в контексте и может использоваться для синтеза высококачественной персонализированной речи с помощью только 3-секундной записи невидимого оратора в качестве акустической подсказки.

Обзор модели здесь
Научное описание здесь