
Emu Video — гэта просты метад генерацыі тэксту ў відэа на аснове мадэляў дыфузіі, які разбівае генерацыю на аснове тэкставай падказкі і згенерыраванага малюнка.
Фактарызаваная генерацыя дазваляе эфектыўна навучаць мадэлі генерацыі відэа высокай якасці. Дадзены падыход патрабуе толькі дзве мадэлі дыфузіі для стварэння 512 пікселяў працягласцю 4 секунды відэа з частатой 16 кадраў у секунду.
Emu Edit — гэта шматзадачная мадэль рэдагавання малюнкаў, якая ўстанаўлівае новы ўзровень мастацтва ў рэдагаванні малюнкаў на аснове інструкцый. Архітэктура Emu Edit адаптавана для шматзадачнага навучання дыяпазону задач, такіх як рэдагаванне ў залежнасці ад рэгіёна, рэдагаванне ў адвольнай форме, і задач камп’ютарнага зроку, такіх як выяўленне і сегментацыя.