随着ChatGPT的爆火,text-to-image文字生成图像、以及更广义的AIGC(AI Generated Content)相关的话题最近一直热度不减。相信大家这几天经常会在各类的自媒体、甚至是自己的朋友圈里看到用人工智能生成的图片。从今天开始,我会用几期视频给大家带来多个完全免费的文字生成图像工具的介绍,让心痒痒的各位好好的解解馋,如果不想错过的话请关注我们。废话不多说,咱们直接上攻略。
今天首先给大家介绍的是基于Diffusion Model的生成工具。Diffusion Model是现在文字生成图像领域的最核心方法,可能还没有之一,当下最知名也最受欢迎的文字生成图像模型Stable Diffusion、Disco-Diffusion、Mid-Journey,DALL-E2 等等,都是基于Diffusion Model的。
Stable Diffusion也是最知名的开源文字生成图像模型,它发布于2022年8月,在GitHub上已有多达18K的star。 Stable Diffusion提供免费试用,甚至连注册都不需要。除了非常友好的可以支持中文输入之外,它的试用网站上还提供了search prompts,prompt generator等不同的交互方式,大家有兴趣都可以去试一试。这儿的prompt就是大家输入的文字的意思。
我分别用中文和英文试验了在Stable diffution的世界里让中国队勇夺世界杯,但效果怎么说呢,着实是有点让人措手不及。明显Stable Diffusion能够一定程度上比较准确的判别文字的语义,而且对于英文的理解要强于中文。但是它所生成的图片就显得过于抽象派了一点,离远一些看还行,离近了看的话人脸都显得有些狰狞恐怖,而且也并非每一张都能够紧扣主题,所以我个人给它打60分吧。