Stable Diffusion 3来了！100%理解提示词，不仅能生成文字，还涌现出物理能力了？

最新推荐文章于 2024-07-16 20:12:44 发布

程序员王饱饱

最新推荐文章于 2024-07-16 20:12:44 发布

阅读量635

点赞数 17

分类专栏： Stable Diffuison应用教程 AI绘画文章标签： stable diffusion 人工智能 AIGC AI绘画入门 AI绘画 SD3

本文链接：https://blog.csdn.net/weixin_55154866/article/details/140035972

版权

AI绘画同时被 2 个专栏收录

138 篇文章 4 订阅

订阅专栏

Stable Diffuison应用教程

114 篇文章 2 订阅

订阅专栏

在文生图领域，Midjourney像是玩具，而Stable Diffusion凭借稳定、可控和高效的能力，一直是最接近可用工具的一款文生图模型。

2024年2月22日，stability.ai发布了 Stable Diffusion 3 早期预览版。这款模型目前已经开发了。

本次更新重点：

在图片质量、多主题提示（multi-subject prompts）和单词拼写能力方面有大幅提升；
使用了新型扩散变压器（类似于Sora）并结合了流量匹配和其他改进；
模型尺寸从 800m 到 8B 参数，将适用于各种设备的部署；
安全贯穿模型训练、测试、评估和部署全过程。

虽然现在还没能开放测试，但一些stability.ai的员工已经开始在社交媒体晒图了。Sora带了一波“好头”。

Prompt：Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat.（一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形，右边是一只狗，左边是一只猫）

**Prompt：**Three transparent glass bottles on a wooden table. The one on the left has red liquid and the number 1. The one in the middle has blue liquid and the number 2. The one on the right has green liquid and the number 3.（木桌上放着三个透明玻璃瓶。左边的是红色液体，数字是 1。中间的是蓝色液体，数字是 2。右边的是绿色液体和数字 3）

Prompt：Anime style illustration of a newsstand on top of a small grassy hill, on top of the newsstand we see the text “it’s here!”. In the background we see a big rain approaching.（一幅动漫风格的插图，画的是小草山顶上的一个报刊亭，在报刊亭的顶部，我们看到 "它来了！"的文字。背景是一场大雨即将来临。）

Prompt：A horse balancing on top of a colorful ball in a field with green grass and a mountain in the background.（在一片绿草如茵的田野上，一匹马在一个五颜六色的球上面保持平衡，背景是一座山）

Prompt：Wide photo of a shipwreck on the beach, lots of rust and moss on the ship contrasting with the beautiful blue of the ocean water and the peace that the beauty of nature conveys. The big waves are magnificent and touch the ship.（海边沉船的宽幅照片，船上的大量锈迹和苔藓与海水的美丽蔚蓝形成鲜明对比，大自然的美给人带来宁静。大浪波澜壮阔，触及船只。）

以上Stable Diffusion 3的图片来自@andrekerygma和@EMostaque。SDXL和DELL-E的部分是通过他们给出的Prompt自己做的。

目前展现出的Stable Diffusion 3的表现基本上可以100%的还原提示词。马的那幅图，还能看到马踩在球上，球发生了形变。

这次更新的一个重点是单词的拼写能力。比如：

Prompt:Photo of an 90’s desktop computer on a work desk, on the computer screen it says “welcome”. On the wall in the background we see beautiful graffiti with the text “SD3” very large on the wall.（办公桌上 90 年代台式电脑的照片，电脑屏幕上写着 “欢迎”。在背景墙上，我们看到了美丽的涂鸦，"SD3 "字样非常醒目。）

Prompt:Resting on the kitchen table is an embroidered cloth with the text ‘good night’ and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic.（灶台上放着一块刺绣布，上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性。）

不管是屏幕上的显像管效果，还是绣布上面的刺绣效果，虽然在提示词中没有给出明确的提示词，Stable Diffusion 3也给welcome、good night这些文字使用了最合适的效果展现，文字和画面融合堪称完美。

之后放出技术细节和开放测试之后，我们也会再上手测试一波，欢迎大家持续关注我们。

不过测试什么的都已经是次要的了，从目前展现出的能力来看，Stable Diffusion 3已经完全可以当做日常的作图使用。

关于AI绘画技术储备

学好 AI绘画不论是就业还是做副业赚钱都不错，但要学会 AI绘画还是要有一个学习规划。最后大家分享一份全套的 AI绘画学习资料，给那些想学习 AI绘画的小伙伴们一点帮助！

👉[[CSDN大礼包：《StableDiffusion安装包&AI绘画入门学习资料》免费分享]]（安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门AI绘画是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以找到适合自己的学习方案

包括：stable diffusion安装包、stable diffusion0基础入门全套PDF，视频学习教程。带你从零基础系统性的学好AI绘画！

1.stable diffusion安装包（全套教程文末领取哈）

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

程序员王饱饱

关注

17
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Stable Diffusion 3来了！100%理解提示词，不仅能生成文字，还涌现出物理能力了？

在文生图领域，Midjourney像是玩具，而Stable Diffusion凭借稳定、可控和高效的能力，一直是最接近可用工具的一款文生图模型。2024年2月22日，stability.ai发布了 Stable Diffusion 3 早期预览版。这款模型目前已经开发了。
复制链接

扫一扫