
Прадстаўляем DeepFloyd IF, новую сучасную мадэль пераўтварэння тэксту ў малюнак з адкрытым зыходным кодам з высокай ступенню фотарэалізму і разуменнем мовы.
Асаблівасці тула:
🗝 глыбокае разуменне тэкставых падказак: канвеер генерацыі выкарыстоўвае моўную мадэль T5-XXL-1.1;
🗝 прымяненне тэкставага апісання да малюнкаў: DeepFloyd IF генерыруе звязны і зразумелы тэкст разам з аб’ектамі розных уласцівасцяў, якія з’яўляюцца ў розных прасторавых суадносінах;
🗝 высокая ступень фотарэалізму:
гэта ўласцівасць адлюстравана ўражлівай ацэнкай FID з нулявым кадрам, роўнай 6,66 у наборы дадзеных COCO;
🗝 магчымасць ствараць выявы з нестандартнымі суадносінамі бакоў, вертыкальнымі або гарызантальнымі, і стандартным квадратным фарматам;
🗝 пераўтварэнне выявы з нулявога кадра ў малюнак.