第一节：调参基础

最新推荐文章于 2024-10-18 14:03:54 发布

春风在哪里

最新推荐文章于 2024-10-18 14:03:54 发布

阅读量832

点赞数 15

分类专栏： stable diffusion 文章标签： AI ai stable diffusion AI作画

本文链接：https://blog.csdn.net/weixin_46375313/article/details/140474846

版权

stable diffusion 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一节：调参基础

参考：https://guide.novelai.dev/guide/prompt-engineering/txt2img
本章内容大多基于 Stable Diffusion WebUI 前端

1、常用参数介绍

Prompt（提示词）： 对想要生成的东西进行文字描述。

Negative prompt（反向提示词）： 用文字描述不希望在图像中出现的东西）：用文字描述不希望在图像中出现的东西。

Sampling Steps（采样步数）： 扩散模型的工作方式是从随机高斯噪声向符合提示的图像迈出小步。这样的步骤应该有多少个。更多的步骤意味着从噪声到图像的更小、更精确的步骤。增加这一点直接增加了生成图像所需的时间。回报递减，取决于采样器。

Sampling method（采样器）： 使用哪种采样器。Euler a（ancestral 的简称）以较少的步数产生很大的多样性，但很难做小的调整。随着步数的增加，非 ancestral 采样器都会产生基本相同的图像，如果你不确定的话，可以使用 LMS。

Batch count（总批次数）： 每次生成图像的组数。一次运行生成图像的数量为 Batch count * Batch size。

Batch size（单批数量）： 同时生成多少个图像。增加这个值可以提高性能，但你也需要更多的 VRAM。图像总数是这个值乘以批次数。除 4090 等高级显卡以外通常保持为 1。

CFG Scale（无分类指导规模，即“提示词引导系数”）： 图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提示（根据模型），但它也在一定程度上降低了图像质量。可以用更多的采样步骤来抵消。

Width： 图像的宽度，像素。要增加这个值，你需要更多的显存。大尺度的图像一致性会随着分辨率的提高而变差（模型是在 512x512 的基础上训练的）。非常小的值（例如 256 像素）也会降低图像质量。这个值必须是 8 的倍数。

Height： 图像高度。

Seed（随机数种子）： 随机数的起点。保持这个值不变，可以多次生成相同（或几乎相同，如果启用了 xformers）的图像。没有什么种子天生就比其他的好，但如果你只是稍微改变你的输入参数，以前产生好结果的种子很可能仍然会产生好结果。

2、Sampling steps 迭代步数

迭代是重复反馈的动作，神经网络中我们希望通过迭代进行多次的训练以到达所需的目标或结果。每一次迭代得到的结果都会被作为下一次迭代的初始值。一个迭代 = 一个正向通过 + 一个反向通过

更多的迭代步数可能会有更好的生成效果，更多细节和锐化，但是会导致生成时间变长。而在实际应用中，30 步和 50 步之间的差异几乎无法区分（默认为20步）。
太多的迭代步数也可能适得其反，几乎不会有提高。
进行图生图的时候，正常情况下更弱的降噪强度需要更少的迭代步数(这是工作原理决定的)。你可以在设置里更改设置，让程序确切执行滑块指定的迭代步数。

3、Samplers 采样器

目前好用的有 Euler，Euler a（更细腻）和 DDIM。
推荐 Euler a 和 DDIM，新手推荐使用 Euler a
Euler a 富有创造力，不同步数可以生产出不同的图片。调太高步数 (>30) 效果不会更好。
DDIM 收敛快，但效率相对较低，因为需要很多 step 才能获得好的结果，适合在重绘时候使用
LMS 和 PLMS 是 Euler 的衍生，它们使用一种相关但稍有不同的方法（平均过去的几个步骤以提高准确性）。大概 30 step 可以得到稳定结果
PLMS 是一种有效的 LMS（经典方法），可以更好地处理神经网络结构中的奇异性
DPM2 是一种神奇的方法，它旨在改进 DDIM，减少步骤以获得良好的结果。它需要每一步运行两次去噪，它的速度大约是 DDIM 的两倍。但是如果你在进行调试提示词的实验，这个采样器效果不怎么样。Euler 是最简单的，因此也是最快的之一