Stable Diffusion 3 终于来了,性能碾压Midjourney、DALL·E

StableAI发布了StableDiffusion3API,该模型在图像质量和遵循文本描述方面表现出色,采用MMDiT架构和DiffusionTransformer技术。同时,强调了安全使用和防止滥用的措施。AIGC技术前景广阔,与人工智能结合将在更多领域发挥作用。
摘要由CSDN通过智能技术生成

4月17日,在Stable Diffusion 3技术报告发布几个月后,Stability AI终于正式发布Stable Diffusion 3 API。

虽然完全开源的SD3模型还没发布,但已经可以在 Fireworks AI 访问 Stable Diffusion 3的API:

https://fireworks.ai/models/stability/sd3

根据人类偏好评估,Stable Diffusion 3在印刷品质和提示词遵从度方面与目前最先进的系统如DALL-E 3和Midjourney v6相当或更优。这意味着生成的图像质量更高,更贴合用户的文本描述。

Stable Diffusion 3采用了新的多模态扩散转换器(MMDiT)架构, 这个构架的核心,采用的是和Sora一样的Diffusion Transformer技术, 并结合了流体动力学匹配(flow matching)及其他技术上的改进。使用单独的权重集合来处理图像和语言输入。

这种设计提高了模型的性能和生成质量,并能更精确地控制出现在图片中的文本内容:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值