Нейрасетка, якая генеруе рух вуснаў
18.05.2024
Wav2Lip – гэта нейрасетка, якая адаптуе відэа з гаворачым тварам пад аўдыязапіс маўлення
У адрозненне ад шэрагу аналагічных тэхналогій яна даволі дакладна генеруе рух вуснаў як для статычных малюнкаў, так і відэа асобных людзей
У аўтаномнай версіі на Github вы можаце:
👪 змяніць некалькі твараў за адзін кадр
📺 працаваць з уваходным відэа высокага дазволу
🔑 дадаваць мэнэджэр ключавых кадраў для лепшага кантролю над стварэннем відэа
🍪 выкарыстаць інтэграцыю coqui TTS
💬 дадаць функцыю размовы з некалькімі людзьмі
🔈 выкарыстаць функцыю запісу ўласнага голасу
👬 кланаваць голас
🎏 перакласці відэа з галасавым клонам