Kolors是什么
可图(Kolors):用于真实感文本到图像合成的扩散模型的有效训练
可图,是快手开源的一个文生图模型,架构上使用了chatglm,比普通的sd模型在中文理解上要强大很多,以往sd模型的提示词理解能力往往只有两种 1、理解英文单词 2、理解中文单词,但是不理解中文俗语, 更不理解句子。可图解决了这个问题, 可以理解长文本中的语义,不需要学习复杂的提示词
可图的一个亮点就是生成图片有文字。(测试发现并不能生成太长的文字)
快速部署
打开网址 CodeWithGPU | 能复现才是好算法 ,这个是autodl算法镜像的社区,里面已经有一个kolros的镜像
可图(Kolors):用于真实感文本到图像合成的扩散模型的有效训练
在网页右侧可以看到如下信息:
镜像版本:
框架:PyTorch: 2.3.0
CUDA:11.8
镜像大小:21.36GB
docker pull registry