Stable Diffusion 入门教程之参数详解(下)

本文详细解读了StableDiffusion的高级绘图参数,包括生成批次、批次数量、提示词引导系数(CFGScale)和不同采样器的选择。这些参数让创作者能根据需求精细调整,以实现最佳的图像生成效果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

      1. 介绍

        上一文中《Stable Diffusion 入门教程之参数详解(上)》对 Stable Diffusion 绘图的常用基础参数进行了解读,本文将继续深入探讨Stable Diffusion绘图的进阶参数,这些参数为用户提供了更多的控制权和灵活性,以便根据创作需求进行精细调整。

        这些进阶参数为Stable Diffusion提供了更多的控制权和灵活性,使用户能够根据自己的创作需求进行精细调整。然而,需要注意的是,调整这些参数可能需要一定的经验和试错,因此建议在使用前仔细阅读本教程,并逐步探索适合自己的参数设置。

     2. 进阶参数

     2.1. 生成批次

        生成批次是指SD一共会生成几批次的图片。这意味着,如果您设置生成批次为3,那么会分三次完成图片的生成任务。每次批次生成结束后,SD会进行内部的计算和处理,然后开始下一批次的生成。这个参数主要影响生成图片所需的总时间。如果您希望更快地得到所有的图片,可以考虑增加生成批次。

    2.2. 批次数量

        批次数量则是指SD在每一批次中生成的图片张数。例如,如果您设置每批数量为5,那么显卡会在每一次批次中生成5张图片。这个参数主要影响每次点击生成按钮时,SD需要处理的图片数量。需要注意的是,每批数量过高可能会导致显存不足,从而导致生成失败。因此,在调整这个参数时,需要根据自己的显卡性能和可用显存来合理设置。

        综合上述这两个参数,您可以计算出每次点击生成按钮时,SD会生成多少张图片。例如,如果生成批次设置为3,每批数量设置为5,那么每次点击生成按钮时,显卡会生成3批次图片,每批5张,总共15张图片。

总批次数和但批数量

     2.3. 提示词引导系数 (CFG Scale)

         提示词引导系数(CFG Scale)在Stable Diffusion中是一个非常重要的参数,它决定了模型在生成图像时对于输入提示词的遵循程度。CFG参数实质上在控制模型输出与文本提示之间的匹配程度,是文本提示对图像生成结果影响力的量化指标。

        当CFG值较低时,模型会拥有更多的自由来发挥创造力,生成的图像可能会与提示词有所偏离,展现出更多的艺术性和原创性。这种情况下,生成的图像可能包含更多的AI创意,有时甚至会产生意想不到的效果,但也更可能包含与提示词不完全相关的元素或场景。

        相反,当CFG值较高时,模型会更加严格地遵循输入的提示词,生成的图像将更贴近文本描述的内容。这有助于确保生成的图像与用户的意图更为一致,但也可能限制了模型的创造性和多样性。在极端高的CFG值下,图像可能会变得过于生硬或不自然,甚至出现伪影

        默认的CFG值为7,这通常被认为是在创造力和生成准确性之间取得平衡的一个合适值。然而,这并不意味着每个场景或提示词都应该使用这个值。在调整过程中需要根据具体的需求和创作目标,适当地调整CFG值来获得更好的生成结果。

        根据经验,在调整CFG值时,需要注意避免将其设置得过低或过高。过低的CFG值可能导致生成的图像与提示词完全脱节,而过高的CFG值则可能限制模型的创造力并导致图像质量下降。通常建议将CFG值保持在5到16的范围内,以确保生成结果的质量和相关性。

提示词引导系数 (CFG Scale)

2.4.采样器 (Sampler)

        这是SD绘图过程中必选的参数,采样器主要用于去除图像噪声和生成随机图像的过程中。采样器通过收集图像中的像素或数据点,来去除图像中的噪声。这种过程可能涉及对图像进行多次重复处理,以得到更“干净”或更清晰的图像版本。去除图像噪声的方法确实多种多样,不同的方法可能在速度和准确性方面有所权衡。一些方法可能更侧重于快速处理,而另一些方法可能更侧重于得到高质量的图像。

        

采样器列表

        我提供的这个版本中SD提供了30多个采样器,我们该如何选择呢?其实常用的有三种,分别是 Euler a,DPM++ 2M Karras 和 DDIM,下面主要对这3个采样器做进一步说明。

采样器说明适用场景
Euler a

Euler a作为一个用于控制时间步长的参数,在需要快速测试变化且不特别注重结果可重复性的情况下,可以作为一个高效且质量相对不错的祖先采样器选择。

ICON,二次元图像,小场景
DPM++ 2M Karras这种方法在每个时间步长中执行多次操作,从而能够在同等分辨率下捕捉到更多的细节。这使得它能够在较小的图像尺寸中纳入更多的内容,比如在小图中展示全身,代价是采样速度更慢。写实人像,复杂场景刻画
DDIM尝试使用超高步数进行图像生成时,DDIM采样方法尤为适用。随着步数的增加,DDIM能够逐步叠加更多的细节信息,从而在保持高效率的同时,进一步提升图像的细节表现。这使得DDIM成为一个非常适合在追求高质量图像细节时的选择。写实人像,复杂场景刻画

        没有一个采样器是完美的,也没有一个采样器能够适用于所有情况。不同的采样器都有其独特的优点和局限性,而图像生成的质量和效率也往往受到多种因素的影响。

        在实际应用中,选择采样器需要根据具体的需求和目标来权衡。如果您追求快速生成图像并且对图像质量的要求不是特别高,那么一些速度较快的采样器可能是更好的选择。而如果您对图像质量有更高的要求,愿意牺牲一些时间来获得更精细的细节,那么一些质量更高的采样器可能更适合您。

3. 总结

        至此,Stable Diffusion主要的绘图参数已经介绍完毕,我们需要结合绘图参数各自的特点,和它们之间存在的关联性,不断地进行调整,不停的“抽卡”,以达到最佳的图像生成效果。

前几期必看文章:

        《Stable Diffusion绘图神器,2分钟极速安装教程!(提供安装包)》

        《Stable Diffusion 模型下载和使用方法》        

        《Stable Diffusion 入门教程之参数详解(上)》

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI探长Kimbo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值