Stable Diffusion教程|文生图基本参数深入浅出！

Ai_绘画小南

于 2024-07-25 11:47:29 发布

阅读量519

点赞数 20

文章标签： stable diffusion 人工智能 AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Java_Joker/article/details/140685841

版权

前言

Stable Diffusion是一款基于深度学习的文本生成图像模型，能够根据用户提供的文本描述创造出高质量、细节丰富的图像。本教程旨在帮助初学者深入理解并有效运用Stable Diffusion的基本参数，从而更好地控制生成图像的效果。我们将通过实例解析，让复杂参数变得通俗易懂，助力您开启精彩的文生图创作之旅。

目录

1 文生图工作流程

2 基本参数详解

3 实战演练

**一、**文生图工作流程

**输入提示词：**您需要提供一段文字描述，明确表达想要生成图像的主题、风格、场景等要素。

**设置参数：**调整Stable Diffusion模型的各项参数，以控制生成图像的质量、风格、细节程度等。

**运行模型：**模型基于输入文本和设置的参数，进行迭代计算，生成对应图像。

**查看结果：**生成的图像将显示在指定位置，您可以根据需要进行保存或进一步编辑。

整理和输出教程属实不易，觉得这篇教程对你有所帮助的话，可以点击👇二维码领取资料😘
在这里插入图片描述

二、基本参数详解

采样迭代步数(Steps)

含义：模型生成图像时进行的迭代次数。步数越多，生成图像的细节越丰富，但也可能增加噪点。

用法：一般在18~30内，过低图像生成不完整无细节，过高轻微优化性价比不高。

采样方法(Sampler)

含义：指的是在模型生成图像的过程中，从模型所学习的概率分布中提取样本的具体算法。这些方法旨在将模型的内在概率知识转化为实际的图像输出，控制从初始噪声状态到最终清晰图像的转化过程。

用法：每次文生图，都需要选择一种采样方法

那么问题来了，30种采样方法，我们怎么选择？需要实验和总结。

实验：

可以用脚本“X/Y/Z plot”，在相同提示词“1girl”下，X轴为30种采样方法，每种都生成一张图，对比看看效果。

**速度快：**Euler系列、LMS系列、DPM++2M、DPM fast、DPM++2M Karras、DDIM系列。

**质量高：**Heum、PLMS、DPM++系列。

**tag利用率高：**DPM2系列、Euler系列。

**动画风：**LMS系列、UniPC。

**写实风：**DPM2系列、Euler系列、DPM++系列。

名词解释：

DPM-扩散概率模型；2M-表示200万步；Karras-是Karras等人提出的。

结论：

1、默认推荐使用DPM++2M Karras生成图片速度快、效果好。

**2、Eluer a采样生成速度最快，但人脸可能扭曲，适合生产icon图标\二次元\小图。
**

**3、DPM++2S a Karras 生成高质量图片，适合写实人物或复杂场景，同时设置setps越高效果越好。
**

4、DDIM效率更高，但二次元可能会变形。

但并不是绝对的，有的大模型和LORA作者，会特别推荐哪种采样方法，那最好照选哦！

宽度高度

含义：设置生成图片的尺寸分辨率，单位是pix

用法：8G显存的显卡，一般用512*512，如果太大容易“爆显存”。（并非真的把显卡爆炸了，是指计算数据量超过显存容量，导致画面错误、帧数骤降、出现崩溃等异常）对于全身照，建议设置为512*768。（升级SDXL大模型，默认都是1024*1024的图）

那你肯定会问了，配置低又要高分辨率咋办？那就需要“高清修复”即可。

高清修复

含义：采用某种放大算法，把低分辨率图片进行放大，通常为避免变形，都是等比例放大倍数，如：放大倍率2 就是 512*512放大1024*1024，比直接生成1024的图占用显存要低。

放大算法：真实图片建议用（R-ESRGAN 4x+），动漫二次元建议（R-ESRGAN 4x+ Anime6B）,最佳质量（LDSR）。

高清修复采样次数：建议0，采用原图。

重绘幅度：建议0.4~0.7，值越大变化越大。

生成批次

含义：就是在绘制多副图像时，显卡按照一张接一张的顺序画。

用法：按需设置几张图 1~4张，提升抽卡的效率。

☆什么是抽卡？☆

SD出图效果比较随机，大家称之为“抽卡”，需要不断的生成新图，从中抽一张最好的图片。

每批数量

含义：就是显卡同时绘制多副图像，但效果通常比较差。

用法：8G显卡就选1即可。

提示词相关性(CFG Scale)

含义：又被称为提示词引导系数，控制模型对输入文本描述的遵循程度。值越大，生成图像越贴近文本描述；值越小，模型的创新性更强，但可能偏离文本描述。

用法：建议7~12,过低会导致图像的饱和度降低，过高则产生粗糙的线条或过度锐化图像甚至图像验证失真。

随机种子(seed)

含义：每个图像的唯一编码，能帮我们复制和调整生成的图片。

用法：-1 代表随机生成一个新seed，其他数字都是具体的seed值。

差异随机种子：指在生成图像过程汇总，每次扩散的步骤使用不同的随机种子，从而融合不同的图像，产生叠加的变化。

差异强度：0~1，0 完全相同，1完全不同

三、实战演练

case1 生成1张512*512分辨率的女孩图片

红框是需要操作的地方。

case2 把case1的图片放大2倍

先固定seed值生成“3781299575”，高清修复放大2倍，重绘0.7，女孩衣服变了样子和姿态没变。

case3 生成1张512*1024分辨率的女孩图片

1 点把seed改为-1，去掉高清修复，调整分辨率高度1024，点击生成。

2 等出图后，再次点击，产生新seed：4054307846

case4 把1和3的融合成512*1024的图****

把随机种子填写case1的seed值，差异种子填写case3的seed值，高度512 宽度1024，差异强调0.2，即可生成。

**

这里直接将该软件分享出来给大家吧~

1.stable diffusion安装包

随着技术的迭代，目前 Stable Diffusion 已经能够生成非常艺术化的图片了，完全有赶超人类的架势，已经有不少工作被这类服务替代，比如制作一个 logo 图片，画一张虚拟老婆照片，画质堪比相机。

最新 Stable Diffusion 除了有win多个版本，就算说底端的显卡也能玩了哦！此外还带来了Mac版本，仅支持macOS 12.3或更高版本。

在这里插入图片描述

2.stable diffusion视频合集

我们在学习的时候，往往书籍源码难以理解，阅读困难，这时候视频教程教程是就很适合了，生动形象加上案例实战，一步步带你入坑stable diffusion，科学有趣才能更方便的学习下去。

在这里插入图片描述

3.stable diffusion模型下载

stable diffusion往往一开始使用时图片等无法达到理想的生成效果，这时则需要通过使用大量训练数据，调整模型的超参数（如学习率、训练轮数、模型大小等），可以使得模型更好地适应数据集，并生成更加真实、准确、高质量的图像。

在这里插入图片描述

4.stable diffusion提示词

提示词是构建由文本到图像模型解释和理解的单词的过程。可以把它理解为你告诉 AI 模型要画什么而需要说的语言，整个SD学习过程中都离不开这本提示词手册。

在这里插入图片描述

5.SD从0到落地实战演练

在这里插入图片描述

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名SD大神的正确特征了。

这份完整版的stable diffusion资料我已经打包好，需要的点击下方插件，即可前往免费领取！

在这里插入图片描述

Ai_绘画小南

关注

20
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Stable Diffusion教程|文生图基本参数深入浅出！

Stable Diffusion是一款基于深度学习的文本生成图像模型，能够根据用户提供的文本描述创造出高质量、细节丰富的图像。本教程旨在帮助初学者深入理解并有效运用Stable Diffusion的基本参数，从而更好地控制生成图像的效果。我们将通过实例解析，让复杂参数变得通俗易懂，助力您开启精彩的文生图创作之旅。目录1 文生图工作流程2 基本参数详解3 实战演练**一、**文生图工作流程**输入提示词：**您需要提供一段文字描述，明确表达想要生成图像的主题、风格、场景等要素。
复制链接

扫一扫

Ai_绘画小南 CSDN认证博客专家 CSDN认证企业博客

码龄3年

950: 原创

8927: 周排名

1581: 总排名

58万+: 访问

: 等级

1万+: 积分

4345: 粉丝

6134: 获赞

13: 评论

6235: 收藏

私信

关注

热门文章

分类专栏

python 270篇

最新评论

爆款频出的AI儿童绘本制作教程来啦！0基础小白也能轻松实现副业自由！
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Python终于可操作WPS了
渐消散: pip install python-wps-client 没有这个库啊？
Python日志库logging总结-可能是目前为止将logging库总结的最好的一篇文章
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、兼容 loguru模式。相比 loguru 有10胜。 pip install nb_log 。
30个Python实用库，助力你的编程之旅
INFINITY^1: 本文内容总结：（对小白而言）有用的燕国地图+“我不装了”。
用 Python 库 PySimpleGUI 制作自动化办公小软件
宇努力学习: 这个包怎么还花钱哇

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。