Универсальный подход к мгновенному клонированию голоса
07.01.2024

Представляем OpenVoice, универсальный подход к мгновенному клонированию голоса, который требует всего лишь короткого аудиоклипа от эталонного говорящего, чтобы воспроизвести его голос и создать речь на нескольких языках.
OpenVoice обеспечивает детальный контроль над стилями голоса, включая эмоции, акцент, ритм, паузы и интонацию, а также воспроизводит цвет тона эталонного диктора. Он также обеспечивает нулевое межъязыковое клонирование голоса для языков, не включенных в обучающий набор носителей языка.
OpenVoice эффективен в вычислительном отношении и стоит в десятки раз меньше, чем коммерчески доступные API, которые предлагают еще худшую производительность.