Stable Diffusion 入门教程之参数详解（下）

AI探长Kimbo

已于 2024-03-19 08:35:48 修改

阅读量2.6k

点赞数 20

于 2024-03-17 19:23:23 首次发布

本文链接：https://blog.csdn.net/meijinbo/article/details/136786115

版权

AI 图像生成同时被 2 个专栏收录

7 篇文章

订阅专栏

Stable Diffusion

7 篇文章

订阅专栏

本文详细解读了StableDiffusion的高级绘图参数，包括生成批次、批次数量、提示词引导系数(CFGScale)和不同采样器的选择。这些参数让创作者能根据需求精细调整，以实现最佳的图像生成效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 介绍

上一文中《Stable Diffusion 入门教程之参数详解（上）》对 Stable Diffusion 绘图的常用基础参数进行了解读，本文将继续深入探讨Stable Diffusion绘图的进阶参数，这些参数为用户提供了更多的控制权和灵活性，以便根据创作需求进行精细调整。

这些进阶参数为Stable Diffusion提供了更多的控制权和灵活性，使用户能够根据自己的创作需求进行精细调整。然而，需要注意的是，调整这些参数可能需要一定的经验和试错，因此建议在使用前仔细阅读本教程，并逐步探索适合自己的参数设置。

2. 进阶参数

2.1. 生成批次

生成批次是指SD一共会生成几批次的图片。这意味着，如果您设置生成批次为3，那么会分三次完成图片的生成任务。每次批次生成结束后，SD会进行内部的计算和处理，然后开始下一批次的生成。这个参数主要影响生成图片所需的总时间。如果您希望更快地得到所有的图片，可以考虑增加生成批次。

2.2. 批次数量

批次数量则是指SD在每一批次中生成的图片张数。例如，如果您设置每批数量为5，那么显卡会在每一次批次中生成5张图片。这个参数主要影响每次点击生成按钮时，SD需要处理的图片数量。需要注意的是，每批数量过高可能会导致显存不足，从而导致生成失败。因此，在调整这个参数时，需要根据自己的显卡性能和可用显存来合理设置。

综合上述这两个参数，您可以计算出每次点击生成按钮时，SD会生成多少张图片。例如，如果生成批次设置为3，每批数量设置为5，那么每次点击生成按钮时，显卡会生成3批次图片，每批5张，总共15张图片。

2.3. 提示词引导系数 (CFG Scale)

提示词引导系数（CFG Scale）在Stable Diffusion中是一个非常重要的参数，它决定了模型在生成图像时对于输入提示词的遵循程度。CFG参数实质上在控制模型输出与文本提示之间的匹配程度，是文本提示对图像生成结果影响力的量化指标。

当CFG值较低时，模型会拥有更多的自由来发挥创造力，生成的图像可能会与提示词有所偏离，展现出更多的艺术性和原创性。这种情况下，生成的图像可能包含更多的AI创意，有时甚至会产生意想不到的效果，但也更可能包含与提示词不完全相关的元素或场景。

相反，当CFG值较高时，模型会更加严格地遵循输入的提示词，生成的图像将更贴近文本描述的内容。这有助于确保生成的图像与用户的意图更为一致，但也可能限制了模型的创造性和多样性。在极端高的CFG值下，图像可能会变得过于生硬或不自然，甚至出现伪影。

默认的CFG值为7，这通常被认为是在创造力和生成准确性之间取得平衡的一个合适值。然而，这并不意味着每个场景或提示词都应该使用这个值。在调整过程中需要根据具体的需求和创作目标，适当地调整CFG值来获得更好的生成结果。

根据经验，在调整CFG值时，需要注意避免将其设置得过低或过高。过低的CFG值可能导致生成的图像与提示词完全脱节，而过高的CFG值则可能限制模型的创造力并导致图像质量下降。通常建议将CFG值保持在5到16的范围内，以确保生成结果的质量和相关性。

2.4.采样器 (Sampler)

这是SD绘图过程中必选的参数，采样器主要用于去除图像噪声和生成随机图像的过程中。采样器通过收集图像中的像素或数据点，来去除图像中的噪声。这种过程可能涉及对图像进行多次重复处理，以得到更“干净”或更清晰的图像版本。去除图像噪声的方法确实多种多样，不同的方法可能在速度和准确性方面有所权衡。一些方法可能更侧重于快速处理，而另一些方法可能更侧重于得到高质量的图像。

我提供的这个版本中SD提供了30多个采样器，我们该如何选择呢？其实常用的有三种，分别是 Euler a，DPM++ 2M Karras 和 DDIM，下面主要对这3个采样器做进一步说明。

采样器	说明	适用场景
Euler a	Euler a作为一个用于控制时间步长的参数，在需要快速测试变化且不特别注重结果可重复性的情况下，可以作为一个高效且质量相对不错的祖先采样器选择。	ICON，二次元图像，小场景
DPM++ 2M Karras	这种方法在每个时间步长中执行多次操作，从而能够在同等分辨率下捕捉到更多的细节。这使得它能够在较小的图像尺寸中纳入更多的内容，比如在小图中展示全身，代价是采样速度更慢。	写实人像，复杂场景刻画
DDIM	尝试使用超高步数进行图像生成时，DDIM采样方法尤为适用。随着步数的增加，DDIM能够逐步叠加更多的细节信息，从而在保持高效率的同时，进一步提升图像的细节表现。这使得DDIM成为一个非常适合在追求高质量图像细节时的选择。	写实人像，复杂场景刻画