StabilityAI接连又放出王炸模型SD3.0

Stability.ai在2024年2月22日晚放出Stable Diffusion 3 模型。

Prompt: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy

Stability声称这是他们迄今为止最为强大的模型,且在多物品领域当中有大功效,在图像质量方面,和字体拼写能力都有很极大的进步。

这个模型还没有能够广泛被使用,所以暂时只开放了Waitlist排队列表来让大家体验这个功能。和之前模型一样,在大规模使用之前需要来测试模型的表现和安全性之后才能放出,大家现在可以通过Waitlist进行申请。

“Stable Diffusion 3”的模型,的参数范围从800M到8B不等。该方法旨在服务于Stability的核心价值与大众可触达度,并通过提供多种可伸缩性和质量选项,以最好地满足用户的创意需求。Stable Diffusion 3结合了 diffusion transformer architectureflow matching。Stability将很快发布一份详细的技术报告,以介绍更多关于这一方法的细节。“

Stable Diffusion 3还提到:

“我们坚信安全、负责任的人工智能实践。这意味着我们已经采取并将继续采取合理的步骤,防止不良行为者滥用Stable Diffusion 3。安全始于我们开始训练模型,贯穿测试、评估和部署的整个过程。为了准备这一早期预览,我们已经引入了许多安全措施。通过与研究人员、专家和我们的社区持续合作,我们期望在接近模型的公开发布时,以诚信创新。”

StabilityAi这个举动也许能够防止SD3用于很多之前SD1.5被广泛使用的灰色场景,很多之前nsfw的内容也许这次“会受到一定的限制”

“Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat”

这张图片的生成其实很好的表现了之前用controlnet还有其他辅助插件生成的空间位置也许现在能够被AI模型的语言能力表达所覆盖

上图上图是用DALL•E 3生成的,说明DALL•E 3和SD3在此方面的能力可能相似。比之下,下图Midjourney在生成这类图片的能力就相对比较差了

上图是搬运的可能是SD3现在的画面和文字图像能力,可以供参考。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Top X AIRT

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值