与Midjourney开战!Stable Diffusion XL 0.9,35亿+66亿双模型

Stable Diffusion又双叒升级了!

最近,Stability AI发布了最新版的Stable Diffusion XL 0.9(SDXL 0.9)。

比起之前的模型,这波更新在图像和构图细节上,都有了质的飞跃。

img

尤其是在参数上,这次的SDXL0.9具有35亿参数基础模型和66亿参数模型的集成管线。相比之下,Beta测试版仅用了单个31亿参数的模型。

为了生成更逼真的图像,以及更大的深度和更高的分辨率(1024x1024),SDXL 0.9使用了两个CLIP模型,包括迄今为止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。

不仅如此,SDXL 0.9在消费级显卡上就能运行。只需要Win10/11或Linux操作系统、16GB内存,以及具有8GB以上显存的英伟达RTX 20系显卡即可。

SDXL 0.9和SDXL Beta的差异究竟有多大?

咱们看图说话。

实测效果

下面就来看看新版的SDXL 0.9,在图片细节上有什么不一样吧~

Prompt:外星人在拉斯维加斯漫步

img

SDXL Beta版

img
SDXL 0.9

Prompt:优胜美地国家公园的一只狼

Negative prompt:3d渲染,光滑,塑料,模糊,颗粒感,低分辨率,动漫,过度饱和

img

SDXL Beta版

img

SDXL 0.9

Prompt:手举咖啡

Negative prompt:3d渲染,光滑,塑料,模糊,颗粒状,低分辨率,动漫

img

SDXL Beta版

img

SDXL 0.9

官方表示,SDXL系列还会提供一系列超越基本文本prompt的功能。

包括图像对图像的prompt(输入一个图像以获得该图像的变化)、内画(重建图像的缺失部分)和外画(构建一个现有图像的无缝扩展)。

SDXL 0.9在两个CLIP模型上运行,包括迄今为止训练的最大的OpenCLIP模型之一(OpenCLIP ViT-G/14),这增强了0.9的处理能力和创造具有更大深度和1024x1024更高分辨率的逼真图像的能力。

SDXL团队不久将发布一个研究博客,更详细地介绍这个模型的规格和测试。

荣登Time最具影响力公司

就在最近,Stability AI被时代杂志选为100家最有影响力的公司之一。

img

对于Stability AI,时代杂志是这样介绍的——

如果你能用文字描述,Stability AI可以将其转化为图片。

Stable Diffusion是该公司帮助训练的免费开源文本到图像生成器,在8月份推出后,它改变了世界对于AI潜力的理解。

然而,Stability AI很快陷入了种种争议,包括如何训练这些工具,以及从互联网上获取数据的版权诉讼之中。

尽管如此,该公司表示,在推出Stable Diffusion 2.0的一个月内,App Store TOP 10应用中的4个,背后都是这个模型。

而公司CEO Emad Mostaque也被报道经常夸大公司的表现,此前他曾声称:Stability AI「真正的开源」为「突破」铺平了道路。

img
SDXL Beta

实际上,SDXL的Beta版本也没发布多久,可见作图这一块的版本迭代真的是日新月异。

当时,StabilityAI就表示,Stable Diffusion XL并不是最终发布版的名字,并且也并非是v3,因为SD-XL的架构和SD-v2系列的模型架构非常相似。

下面几张SD-XL官方发布的例图,可以看出图像的质量已经非常能打了。

img
img

SD-XL相比之前版本的改进如下:

  • 使用较短的描述性prompt即可生成高质量图像
  • 可以生成更贴合prompt的图像
  • 图像中的人体结构更合理
  • 与 v2.1和 v1.5版本(程度较轻)相比,SD-XL生成的图片更符合大众审美
  • 负面提示词(negative prompt)是可选项
  • 生成的肖像图更逼真
  • 图像中的文本更清晰

清晰可读的文字

在v1系列和v2.1版本的Stable Diffusion模型中,并不具备在图片中生成可读文本的能力。

虽然SD-XL生成的文本信息并不总是准确,但确实得到了巨大的提升。

img

一个年轻的女性举着一个牌子,上面写着「Stable Diffusion」,头发高亮,坐在餐厅外面,棕色的眼睛,穿着裙子,侧灯

更好的人体结构

Stable Diffusion在生成人体解剖结构方面一直存在诸多问题,多几条腿、少个胳膊实在是太常见不过的问题。

比如说SD-v1.5生成瑜伽的图像,经常会出现扭曲的人体。

而SD-XL虽然生成的图像并不完美,不过在人体姿态方面已经有了显著的进步。

img

更有美感(more aesthetic)

比如同样以屋子为主题,SD-XL可以生成更对称、视觉效果更好的照片。

img

SD-XL在肖像照片上也有显著改进。

img
一个女人的照片

关于AI绘画技术储备

学好 AI绘画 不论是就业还是做副业赚钱都不错,但要学会 AI绘画 还是要有一个学习规划。最后大家分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点帮助!

👉[[CSDN大礼包:《StableDiffusion安装包&AI绘画入门学习资料》免费分享]]安全链接,放心点击

对于0基础小白入门:

如果你是零基础小白,想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括:stable diffusion安装包、stable diffusion0基础入门全套PDF,视频学习教程。带你从零基础系统性的学好AI绘画!

零基础AI绘画学习资源介绍

👉stable diffusion新手0基础入门PDF👈

(全套教程文末领取哈)
在这里插入图片描述

👉AI绘画必备工具👈

在这里插入图片描述

👉AI绘画基础+速成+进阶使用教程👈

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末

👉大厂AIGC实战案例👈

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉12000+AI关键词大合集👈

在这里插入图片描述
这份完整版的学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

  • 15
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值