Мы выкарыстоўваем файлы cookie на гэтым сайце для паляпшэння вашага вопыту карыстання.
Для больш падрабязнай інфармацыі азнаёмцеся з Палітыка канфідэнцыяльнасці

Новая мадэль пераўтварэння тэксту ў малюнак
29.01.2024

Прадстаўляем DeepFloyd IF, новую сучасную мадэль пераўтварэння тэксту ў малюнак з адкрытым зыходным кодам з высокай ступенню фотарэалізму і разуменнем мовы.

Асаблівасці тула:
🗝 глыбокае разуменне тэкставых падказак: канвеер генерацыі выкарыстоўвае моўную мадэль T5-XXL-1.1;
🗝 прымяненне тэкставага апісання да малюнкаў: DeepFloyd IF генерыруе звязны і зразумелы тэкст разам з аб’ектамі розных уласцівасцяў, якія з’яўляюцца ў розных прасторавых суадносінах;
🗝 высокая ступень фотарэалізму:
гэта ўласцівасць адлюстравана ўражлівай ацэнкай FID з нулявым кадрам, роўнай 6,66 у наборы дадзеных COCO;
🗝 магчымасць ствараць выявы з нестандартнымі суадносінамі бакоў, вертыкальнымі або гарызантальнымі, і стандартным квадратным фарматам;
🗝 пераўтварэнне выявы з нулявога кадра ў малюнак.

Крыніца