突发！Stable Diffusion 3，可通过API使用啦

最新推荐文章于 2024-07-06 08:53:56 发布

爱AI绘画的阿皮皮

最新推荐文章于 2024-07-06 08:53:56 发布

阅读量797

点赞数 7

文章标签： stable diffusion midjourney AIGC AI作画人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xxwn202302/article/details/137919285

版权

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和_应用_落地，聚焦LLM的市场研究和AIGC开发者生态，欢迎关注！

4月18日，著名开源大模型平台Stability.ai在官网宣布，最新文生图模型Stable Diffusion 3 （简称“SD3”）和 SD3 Turbo可以在API中使用。

据悉，本次继续由知名API管理平台Fireworks AI提供服务。与前两代相比，SD3除了生成的图片质量更高之外，可以更好地理解提示文本中嵌入到图片中的文字。

例如，一个色彩缤纷的魔法世界，天空的中央写着“欢迎来到魔法世界”。

前两个模型版本可能无法将“欢迎来到魔法世界”精准嵌入到图片的指定位置或出现扭曲的文字，而SD3可以轻松实现。

此外，SD3的模型权重将很快向Stability AI会员提供，可以在本地部署、运行SD3。

API地址：https://platform.stability.ai/docs/api-reference?_gl=1*1ldjred*_ga*ODY1NjAxMzA1LjE3MDcyNTYwMTM.*_ga_W4CMY55YQZ*MTcxMzM5NDE4OS40NC4xLjE3MTMzOTQyNTUuMC4wLjA.#tag/Generate/paths/_1v2beta1stable-image_1generate1sd3/post

Stable Diffusion 3架构简单介绍

今年2月22日，Stability.ai在官网首次展示了SD3并开启候补测试。随后3月5日在arxiv上公布了其论文。

根据其论文介绍，SD3与前两代相比最大技术创新在于，使用了MM-DiT和Flow Matching两种方法来增强模型的输出、训练、优化等，同时支持文本或图像作为提示实现多模态能力。

通常多数文生图模型在生成的过程中，只考虑图像本身而没有充分利用文本信息，所以，输出结果时经常出现“驴头不对马嘴”的情况，甚至是一些无法理解的乱码或者扭曲的图像。

而MM-DiT通过结合Transformer的自注意力机制强大的文本和图像序列处理能力，帮助模型在生成图像时能与文本实现更好的匹配。

当用户输入文本或图像提示时，首先被转换为嵌入表示。文本通过预训练的文本模型编码，而图像则通过预训练的自动编码器转换为潜在空间表示。

MM-DiT会使用一种调制机制来整合时间步和文本条件信息，会将时间步和文本嵌入与图像的潜在表示进行整合。

接着，MM-DiT会利用一系列的调制注意力和多层感知力进一步混合文本和图像特征。这些块允许模型在保留各自模态特征的同时，进行跨模态的信息交流。

为了帮助SD3更好地处理多模态数据，MM-DiT采用了多头注意力机制，允许模型在不同的表示子空间中并行处理信息。

这也是SD3能深度理解文本提示中的嵌入文字主要原因，MMDiT不仅能将文字转换成图片，还能确保图片能够反映出文字中的所有细节。

根据测试数据显示，与DiT、CrossDiT、UViT等方法相比，MM-DiT所有指标上表现都非常出色，并且在内部共享权重集。

Flow Matching是一种用于训练Rectified Flow模型的方法，通过最小化生成路径上的误差来改善模型性能，同时帮助模型学习从随机噪声快速转换到目标图像。

在训练过程中，Flow Matching会先定义一个从数据分布到噪声分布的前向过程，这个过程通过一系列的时间步骤来模拟，每个步骤都对应着数据向噪声的逐渐转变。

接着，通过对每个时间步的噪声样本生成一个向量场，可以在概率空间中模拟数据到噪声的转换。

最后，Flow Matching通过最小化一个目标函数来优化生成向量场。该目标函数的作用是帮助模型预测的向量场和真实向量场之间的差异。优化的过程中会尽量减小这个差异，从而提高模型的生成图像预测准确性。

关于SD3更详细的技术解读，小伙伴们可以查看论文。

SD3生成图片展示

根据Stability.ai展示的效果，SD3生成的图片有一些甚至比Midjourney更好，尤其是文字嵌入方面。

一座白色建筑顶部放着一张红色沙发。涂鸦强上写着“城市最佳景观”。

一个印有“他们说在这里思考不好”的纸板箱，纸板箱很大，放在剧场舞台上。

半透明的猪，肚子里有一只更小的猪。

一只奶酪制作的螃蟹，在盘子中。

在山顶上有一位巫师创作了一幅令人惊叹的艺术作品，他用魔法创造了文字"Stable Diffusion 3 API"。

本文素材来源Stability.ai官网、SD3论文，如有侵权请联系删除

END

写在最后

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照下面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了，安装就可直接上手！
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础，有自己的理解能力的时候，会去阅读一些前辈整理的书籍或者手写的笔记资料，这些笔记详细记载了他们对一些技术点的理解，这些理解是比较独到，可以学到不一样的思路。
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅，要学会跟着视频一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。
在这里插入图片描述

在这里插入图片描述

若有侵权，请联系删除

爱AI绘画的阿皮皮

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
突发！Stable Diffusion 3，可通过API使用啦

感兴趣的小伙伴，赠送全套AIGC学习资料，包含AI绘画、AI人工智能等前沿科技教程和软件工具，具体看这里。AIGC技术的未来发展前景广阔，随着人工智能技术的不断发展，AIGC技术也将不断提高。未来，AIGC技术将在游戏和计算领域得到更广泛的应用，使游戏和计算系统具有更高效、更智能、更灵活的特性。同时，AIGC技术也将与人工智能技术紧密结合，在更多的领域得到广泛应用，对程序员来说影响至关重要。未来，AIGC技术将继续得到提高，同时也将与人工智能技术紧密结合，在更多的领域得到广泛应用。
复制链接

扫一扫

爱AI绘画的阿皮皮 CSDN认证博客专家 CSDN认证企业博客

码龄1年

156: 原创

104万+: 周排名

1万+: 总排名

12万+: 访问

: 等级

4029: 积分

1754: 粉丝

2400: 获赞

17: 评论

2189: 收藏

私信

关注

热门文章

分类专栏

AI 9篇

最新评论

【comfyui】AI绘画一键换脸工作流，学会你也可以实现随时换脸啦
为什么不吃猪猪: 我在“comfyUI manager安装（推荐）”这个界面没有管理器这个选项，要怎么办呢
AI绘画︱每日咒语提示词
CSDN-Ada助手: 恭喜你发布了第19篇博客！看到你每日分享AI绘画的咒语提示词，感觉真是别具一格，让人眼前一亮。希望你能继续坚持创作，不断探索新的灵感和主题，或许可以考虑尝试结合不同的艺术形式或者加入更多个人化的元素，让作品更加丰富多彩。期待你的下一篇作品！愿你的创作之路越走越顺，不忘初心，砥砺前行。
AI绘画小白福音！Stable Diffusion 保姆级教程
CSDN-Ada助手: 恭喜作者第20篇博客的里程碑！看到AI绘画小白的福音，真是让人感到兴奋。Stable Diffusion的保姆级教程一定能帮助更多人进入这个领域，让人们更轻松地享受AI绘画的乐趣。希望作者能够继续分享更多有趣的教程和经验，让更多人受益。或许下一个主题可以是AI在音乐创作中的应用，期待作者的精彩呈现！
7大AI绘画“ 炸裂”应用趋势，离谱的创新力，又有多少人要失业了！
CSDN-Ada助手: 恭喜您撰写了如此引人入胜的博客！AI绘画应用的发展确实令人瞩目，不仅展现出了惊人的创新力，也让我们思考未来技术对人类的影响。希望您能继续保持创作的热情，探索更多关于AI在艺术领域的可能性。或许可以深入探讨AI绘画与传统艺术的融合，或是AI创作对人类创作者的启发等话题，期待您的下一篇精彩作品！
AI绘画 | 一整个粉住你！
CSDN-Ada助手: 恭喜您第16篇博客的成功发布！AI绘画确实是一个令人着迷的领域，看到您对这个话题的热情和探索精神，让人不禁感到钦佩。希望您能继续保持创作的热情，探索更多关于AI绘画的新颖内容。或许在下一篇博客中，可以尝试探讨AI绘画与传统绘画的结合，或者挑战更复杂的绘画主题，让读者能够更全面地了解这个领域。期待您的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。