与Midjourney开战！Stable Diffusion XL 0.9，35亿+66亿双模型

网安福宝

于 2024-05-10 10:34:41 发布

阅读量595

点赞数 15

分类专栏： SD教程 AI绘画文章标签： midjourney stable diffusion AI绘画 AI作画人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/WANGJUNAIJIAO/article/details/138654650

版权

AI绘画同时被 2 个专栏收录

231 篇文章 7 订阅

订阅专栏

210 篇文章 3 订阅

订阅专栏

Stable Diffusion又双叒升级了！

最近，Stability AI发布了最新版的Stable Diffusion XL 0.9（SDXL 0.9）。

比起之前的模型，这波更新在图像和构图细节上，都有了质的飞跃。

尤其是在参数上，这次的SDXL0.9具有35亿参数基础模型和66亿参数模型的集成管线。相比之下，Beta测试版仅用了单个31亿参数的模型。

为了生成更逼真的图像，以及更大的深度和更高的分辨率（1024x1024），SDXL 0.9使用了两个CLIP模型，包括迄今为止最大的OpenCLIP模型（OpenCLIP ViT-G/14）。

不仅如此，SDXL 0.9在消费级显卡上就能运行。只需要Win10/11或Linux操作系统、16GB内存，以及具有8GB以上显存的英伟达RTX 20系显卡即可。

SDXL 0.9和SDXL Beta的差异究竟有多大？

咱们看图说话。

实测效果

下面就来看看新版的SDXL 0.9，在图片细节上有什么不一样吧~

Prompt：外星人在拉斯维加斯漫步

SDXL Beta版

SDXL 0.9

Prompt：优胜美地国家公园的一只狼

Negative prompt：3d渲染，光滑，塑料，模糊，颗粒感，低分辨率，动漫，过度饱和

SDXL Beta版

SDXL 0.9

Prompt：手举咖啡

Negative prompt：3d渲染，光滑，塑料，模糊，颗粒状，低分辨率，动漫

SDXL Beta版

SDXL 0.9

官方表示，SDXL系列还会提供一系列超越基本文本prompt的功能。

包括图像对图像的prompt（输入一个图像以获得该图像的变化）、内画（重建图像的缺失部分）和外画（构建一个现有图像的无缝扩展）。

SDXL 0.9在两个CLIP模型上运行，包括迄今为止训练的最大的OpenCLIP模型之一（OpenCLIP ViT-G/14），这增强了0.9的处理能力和创造具有更大深度和1024x1024更高分辨率的逼真图像的能力。

SDXL团队不久将发布一个研究博客，更详细地介绍这个模型的规格和测试。

荣登Time最具影响力公司

就在最近，Stability AI被时代杂志选为100家最有影响力的公司之一。

对于Stability AI，时代杂志是这样介绍的——

如果你能用文字描述，Stability AI可以将其转化为图片。

Stable Diffusion是该公司帮助训练的免费开源文本到图像生成器，在8月份推出后，它改变了世界对于AI潜力的理解。

然而，Stability AI很快陷入了种种争议，包括如何训练这些工具，以及从互联网上获取数据的版权诉讼之中。

尽管如此，该公司表示，在推出Stable Diffusion 2.0的一个月内，App Store TOP 10应用中的4个，背后都是这个模型。

而公司CEO Emad Mostaque也被报道经常夸大公司的表现，此前他曾声称：Stability AI「真正的开源」为「突破」铺平了道路。

SDXL Beta

实际上，SDXL的Beta版本也没发布多久，可见作图这一块的版本迭代真的是日新月异。

当时，StabilityAI就表示，Stable Diffusion XL并不是最终发布版的名字，并且也并非是v3，因为SD-XL的架构和SD-v2系列的模型架构非常相似。

下面几张SD-XL官方发布的例图，可以看出图像的质量已经非常能打了。

SD-XL相比之前版本的改进如下：

使用较短的描述性prompt即可生成高质量图像
可以生成更贴合prompt的图像
图像中的人体结构更合理
与 v2.1和 v1.5版本(程度较轻)相比，SD-XL生成的图片更符合大众审美
负面提示词（negative prompt）是可选项
生成的肖像图更逼真
图像中的文本更清晰

清晰可读的文字

在v1系列和v2.1版本的Stable Diffusion模型中，并不具备在图片中生成可读文本的能力。

虽然SD-XL生成的文本信息并不总是准确，但确实得到了巨大的提升。

一个年轻的女性举着一个牌子，上面写着「Stable Diffusion」，头发高亮，坐在餐厅外面，棕色的眼睛，穿着裙子，侧灯

更好的人体结构

Stable Diffusion在生成人体解剖结构方面一直存在诸多问题，多几条腿、少个胳膊实在是太常见不过的问题。

比如说SD-v1.5生成瑜伽的图像，经常会出现扭曲的人体。

而SD-XL虽然生成的图像并不完美，不过在人体姿态方面已经有了显著的进步。

更有美感（more aesthetic）

比如同样以屋子为主题，SD-XL可以生成更对称、视觉效果更好的照片。

SD-XL在肖像照片上也有显著改进。

一个女人的照片

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

👉[[CSDN大礼包：《StableDiffusion安装包&AI绘画入门学习资料》免费分享]]（安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，视频学习教程。带你从零基础系统性的学好AI绘画！

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

（全套教程文末领取哈）
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。
在这里插入图片描述
温馨提示：篇幅有限，已打包文件夹，获取方式在：文末

👉大厂AIGC实战案例👈

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

👉12000+AI关键词大合集👈

在这里插入图片描述
这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

关注

15
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄2年

817
原创

4556
点赞

6325
收藏

3260
粉丝

关注

私信

热门文章

分类专栏

AI绘画 231篇
SD教程 210篇
编程 291篇
python 416篇
Python入门 151篇
网络安全 151篇
Python爬虫 23篇
web安全 12篇
计算机 1篇
兼职 7篇
安全 4篇

最新评论

我觉得我用于Stable Diffusion进行AI绘画的电脑选对了
2401_87785601: 谢谢你的分享，你想的很周到，很细致。我也同意你的想法，我也正在考虑选择如如何的那种合适合格的电脑，而且性价比要好。还有一点，嗯，是选择台式机还是选择笔记本？没有什么建议能帮我提一提吗？非常感谢你。
「ai学习指南」从入门到精通，附最新AI资源合集！
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
我把我的声音训练成了AI模型，并让它唱了一首歌...（附超全面教程，你奶奶看了都会用）
DebugDiva: 这篇文章太酷了！作者用AI实现了自己的唱歌梦，不仅让AI学了他的声音，还唱了首"富士山"。教程详细，从声音采集到模型训练都讲到了，用到的工具和平台也分享了，感觉跟着做一遍，真有可能让你奶奶也学会用AI唱歌呢！可惜So-VITS-SVC项目停更了，但整体过程还是很有参考价值的。
我把我的声音训练成了AI模型，并让它唱了一首歌...（附超全面教程，你奶奶看了都会用）
小周小周_招待不周: 训练好慢一小时才跑60轮全部不是要160多小时有什么办法吗
一遍就会！Stable Diffusion 文生图最全、最强教程！
码农小筑: 文章清晰明了，Stable Diffusion的解析和实践步骤都很到位，对新手特别友好。跟着教程走，文生图变得简单多了，真是个学习AI绘画的好资源。推荐给想要尝试的朋友们，动手试试吧！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。