Нейронная сеть, генерирующая движения губ
18.05.2024

Wav2Lip — это нейронная сеть, которая адаптирует видео говорящего лица к речевому звуку.
В отличие от ряда аналогичных технологий, она достаточно точно генерирует движение губ как для статичных изображений, так и для видео отдельных людей.
В офлайн-версии на Github вы можете:
👪 изменить несколько лиц в одном кадре
📺 работа с входным видео высокого разрешения
🔑 добавьте менеджер ключевых кадров для лучшего контроля над созданием видео
🍪 используйте интеграцию Coqui TTS
💬 добавить функцию чата с несколькими людьми
🔈 используйте функцию записи собственного голоса
👬 клонировать голос
🎏 перевести видео с помощью голосового клона