AI绘画神器Stable Diffusion模型再升级,带你零基础入门Stable Diffusion全套教学

在这里插入图片描述

之前为大家对比了 6 款在线 AI 绘画软件在不同主题上的图像生成效果,最终是 Midjourney 的整体表现最好,而 Stability AI 官方模型 Stable Diffusion v2.1 则表现不尽如人意。最近 Stability AI 又推出了一个新模型 Stable Diffusion XL,参数是 SD v2.1 的 2.5 倍,那这个新模型的图像生成效果如何呢?今天就继续来测试一下。

Stable Diffusion XL 简介

DreamStudio - SD XL:
梦幻工作室 (dreamstudio.ai) (新用户有 200 点免费生成额度)

Clipdrop - SD XL:
ClipDrop - Stable Diffusion (目前免费生成)

此次 Stable Diffusion XL 一共更新在两个平台上,一是 Stability AI 官方 AI 绘画软件 DreamStudio,另一个则是之前被 Stability AI 收购的 AI 图像处理平台 Clipdrop。二者的区别在于 DreamStudio 上有很多的可调节参数,比如画面比例、图像数量等,Clipdrop 是统一的 1:1 的画面比例,一次生成 4 张,单张图像放大后可达到 1024*1024px。

在这里插入图片描述
据 Stability AI 官网介绍,SD XL 模型支持用更短的提示创建描述性图像,并在可以在图像中生成文字,模型增强了图像的构图和脸部生成能力,使画面更加逼真和美观。

在这里插入图片描述
生成准确的文字和画手一样,一直是 AI 绘画中的难题,直到 Controlnet 插件出现 ,我们才能在 SD WebUI 中通过轮廓检测功能固定文字外形,从而生成精准的文字内容,而此次 SD XL 模型可以生成文字无疑是又是 AI 绘画的一大进步。我分别在 Midjourney 和 SD XL 中用文本提示词进行测试,结果是 SD XL 的文字生成效果的确比 Midjourney 好。

在这里插入图片描述
接着继续用和之前一样的主题进行图像生成测试。首先是人像,可以看出 SD XL 比 v2.1 的效果要好很多,构图正确,人物面部没有扭曲变形,整体质感也好很多,质量看起来并不比 Midjourney 差,说明 XL 模型在照片真实性上有进行专门的优化 。

在这里插入图片描述
然后是动漫风,XL 生成的图像在画面整体质量有明显提升,应该是对数据集进行了优化,但是有一个非常大的缺点就是五官和四肢不正常,在生成的 2 批 8 张图像中,每一张都有五官四肢不正常的情况,图像可用率极低。

在这里插入图片描述

而在 3D 风格上 XL 模型还是有比较明显的进步的,无论是人物精细度还是画面整体美感都比之前的 v2.1 要好,不过和动漫风一样存在四肢不正常的情况,下面是我从生成的 4 张图像中挑出的双手看起来比较正常的一张,感觉 XL 模型在这一块的训练没做好。

在这里插入图片描述
最后再看一下矢量扁平插画和概念场景的表现 ,同样都有非常明显的美感提升,不过也能看出 SD XL 在文本提示的理解上还有缺陷,在扁平插画的测试中它忽略了“白色背景”这一关键词;而由于 SD XL 目前还是测试版,画面尺寸不能做到 16:9,这也让图像的表现性受限。

在这里插入图片描述通过上面的图像生成测试可以看出,Stable Diffusion 的 XL 模型 比 V2.1 在质量上有了明显进步,特别是在人像质量上,虽还不能达到 midjourney V5 的水平,但是在目前的 AI 绘画工具总也算表现比较好的;新增的文字生成功能也是比较独特的,除了接入 Controlnet 的 SD WebUI,其他 AI 绘画工具目前都还没有生成准确文字内容的能力。

同时 Stable Diffusion XL 的缺点也是比较明显的,即人物的四肢不正常,这点在动漫和 3D 风格中尤为突出;模型对提示文本的理解能力也有缺陷,会漏掉一些关键词语,期待 Stability AI 在后续的更新中能进一步优化现在这些问题。

stable diffusion整合包分享

我自从博士毕业之后一直在大厂里面干AI相关的算法,而且也都跟内容生产相关。

可以说,现在这些大厂对AI技术是非常沉迷的,也是投入了很多精力去研发。

某公司前段时间还发邮件说要all in ai.

我个人非常看好AI技术的发展,但我感觉,最大的受益者不会是这些大厂,而是我们中小型的创作者。

我意识到我有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的stable diffusion资料包括工具安装包、精品SD学习书籍手册、视频教程、提示词手册等免费分享出来。

这份完整版的SD资料我已经打包好,需要的点击下方CSDN二维码,即可前往免费领取!

在这里插入图片描述

1.stable diffusion安装包

随着技术的迭代,目前 Stable Diffusion 已经能够生成非常艺术化的图片了,完全有赶超人类的架势,已经有不少工作被这类服务替代,比如制作一个 logo 图片,画一张虚拟老婆照片,画质堪比相机。

最新 Stable Diffusion 除了有win多个版本,就算说底端的显卡也能玩了哦!此外还带来了Mac版本,仅支持macOS 12.3或更高版本

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,一步步带你入坑stable diffusion,科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果,这时则需要通过使用大量训练数据,调整模型的超参数(如学习率、训练轮数、模型大小等),可以使得模型更好地适应数据集,并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言,整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好,需要的点击下方二维码,即可前往免费领取!

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值