Disco-Diffusion5.2 本地搭建测试记录
Disco Diffusion基于CLIP-Guided Diffusion网络实现文本输入,美图输出,还可以选不同的画家风格。具体技术实现不在这里讲了可以参考官方文档后面的资源部分。或者看论文。
友情论文秃头链接:https://arxiv.org/abs/2105.05233https://arxiv.org/abs/2105.05233
好了下面开始Debug,先上一组自己生成的图,图下面是生成图像用的文字说明,制定画家和场景关键词描述就可以出图。
artstation,Greg Rutkowski,city,dream,universe,original,time,cloud,future,night
A cyberpunk city with a spaceship in the sky
artstation,Greg Rutkowski,sea,dikel,ship,industrialization,cloud,time,future,afternoon
通过更改笔记本中文字重新运行就可以生成不同风格的图片,我用的是RTX3090的卡,生成图像分辨率为1280*768,其它配置用的默认,大概25-30分钟一张图,比Colab普通版快3倍左右。想看其它小伙伴生成的图可以去Discord,有挺多好看的图片。
https://discord.gg/XGZrFFCRfNhttps://discord.gg/XGZrFFCRfN
一、项目官方文档
官方英文文档
简单机翻了一下的文档
Docshttps://u64b10hj3j.feishu.cn/docs/doccn8fbnQ6MnkCAFQpcjADO7Ae
项目Github地址