Bytedance представила Omnihuman-1 — мультимодальную модель генерации видео
11.02.2025

Omnihuman-1 генерирует человеческое видео на основе одного изображения или фотографии человека и сигналов движения (например, только аудио, только видео или комбинация аудио и видео).
💨 OmniHuman значительно превосходит существующие методы, создавая чрезвычайно реалистичные видеоролики людей на основе слабых сигналов, особенно аудио. Он поддерживает ввод изображений, независимо от того, являются ли они портретами, изображениями половины тела или изображениями в полный рост, обеспечивая более реалистичные и высококачественные результаты в различных сценариях.