第一节:调参基础

第一节:调参基础

参考:https://guide.novelai.dev/guide/prompt-engineering/txt2img
本章内容大多基于 Stable Diffusion WebUI 前端

1、常用参数介绍

Prompt(提示词): 对想要生成的东西进行文字描述。

Negative prompt(反向提示词): 用文字描述不希望在图像中出现的东西):用文字描述不希望在图像中出现的东西。

Sampling Steps(采样步数): 扩散模型的工作方式是从随机高斯噪声向符合提示的图像迈出小步。这样的步骤应该有多少个。更多的步骤意味着从噪声到图像的更小、更精确的步骤。增加这一点直接增加了生成图像所需的时间。回报递减,取决于采样器。

Sampling method(采样器): 使用哪种采样器。Euler a(ancestral 的简称)以较少的步数产生很大的多样性,但很难做小的调整。随着步数的增加,非 ancestral 采样器都会产生基本相同的图像,如果你不确定的话,可以使用 LMS。

Batch count(总批次数): 每次生成图像的组数。一次运行生成图像的数量为 Batch count * Batch size。

Batch size(单批数量): 同时生成多少个图像。增加这个值可以提高性能,但你也需要更多的 VRAM。图像总数是这个值乘以批次数。除 4090 等高级显卡以外通常保持为 1。

CFG Scale(无分类指导规模,即“提示词引导系数”): 图像与你的提示的匹配程度。增加这个值将导致图像更接近你的提示(根据模型),但它也在一定程度上降低了图像质量。可以用更多的采样步骤来抵消。

Width: 图像的宽度,像素。要增加这个值,你需要更多的显存。大尺度的图像一致性会随着分辨率的提高而变差(模型是在 512x512 的基础上训练的)。非常小的值(例如 256 像素)也会降低图像质量。这个值必须是 8 的倍数。

Height: 图像高度。

Seed(随机数种子): 随机数的起点。保持这个值不变,可以多次生成相同(或几乎相同,如果启用了 xformers)的图像。没有什么种子天生就比其他的好,但如果你只是稍微改变你的输入参数,以前产生好结果的种子很可能仍然会产生好结果。

2、Sampling steps 迭代步数

迭代是重复反馈的动作,神经网络中我们希望通过迭代进行多次的训练以到达所需的目标或结果。 每一次迭代得到的结果都会被作为下一次迭代的初始值。 一个迭代 = 一个正向通过 + 一个反向通过

更多的迭代步数可能会有更好的生成效果,更多细节和锐化,但是会导致生成时间变长。而在实际应用中,30 步和 50 步之间的差异几乎无法区分(默认为20步)。
太多的迭代步数也可能适得其反,几乎不会有提高。
进行图生图的时候,正常情况下更弱的降噪强度需要更少的迭代步数(这是工作原理决定的)。你可以在设置里更改设置,让程序确切执行滑块指定的迭代步数。

3、Samplers 采样器

目前好用的有 Euler,Euler a(更细腻)和 DDIM。
推荐 Euler a 和 DDIM,新手推荐使用 Euler a
Euler a 富有创造力,不同步数可以生产出不同的图片。调太高步数 (>30) 效果不会更好。
DDIM 收敛快,但效率相对较低,因为需要很多 step 才能获得好的结果,适合在重绘时候使用
LMS 和 PLMS 是 Euler 的衍生,它们使用一种相关但稍有不同的方法(平均过去的几个步骤以提高准确性)。大概 30 step 可以得到稳定结果
PLMS 是一种有效的 LMS(经典方法),可以更好地处理神经网络结构中的奇异性
DPM2 是一种神奇的方法,它旨在改进 DDIM,减少步骤以获得良好的结果。它需要每一步运行两次去噪,它的速度大约是 DDIM 的两倍。但是如果你在进行调试提示词的实验,这个采样器效果不怎么样。Euler 是最简单的,因此也是最快的之一

老派采样器
LMS :线性多步法,速度和Euler差不多但没有Euler稳定,易出色块
LMS Karras
Heun
Euler的升级版,画质更好但速度慢一倍
DDIM
第一代,过时
PLMS第一代,过时
Euler
可收敛:简单直接,不易出错
Euler a
不可收敛:其中“a”代表祖先采样器,画面不能收敛
DPM采样器
DPM++3M  SDE Karras
速度和2M一样,需要更多采样步数,调低CFG,采样步数>30步效果更好
DPM++3M  SDE Exponential
DPM++2M Karras
最推荐的算法,收敛,速度快,质量OK
DPM++SDE Karras
1.随机微分方程算法,不收敛,高品质,速度快;
2.渲染真实系图片,追求画质的时候可使用该采样器
DPM++2M SDE Exponential
1、Exponential1.6版本后的,指数算法,不收敛,细节少些,但画面柔和干净
DPM++2M SDE Karras
2M和SDE的折中短发,不收敛,速度有所提升
DPM2
DPM2a
DPM2:画面有提升,时间增加一倍
DPM++2S a
DPM++2M
DPM++SDE
DPM++2M SDE
DPM++2M SDE Heun
1、Karras:优化算法的,8步之后噪点更少,故只保留待Karras的算法即可
2、2S/2M:S代表单步算法,M代表多步算法
2M是2S的升级算法,故可以去掉2S相关的算法
DPM++2M SDE Heun Karras
DPM++2M SDE Heun Exponential
DPM++3M  SDE
DPM2 Karras
DPM2 a Karras
DPM++2S a Karras
DPM fast
DPM adaptive
新派采样器
UniPC
2023年新算法,同意预测校正器,兼容性很好,收敛,10步左右能生成可用画面
Restart
每步渲染时间长些,但只需很少的采样步数,就能生成质量相当不错的图片

4、CFG Scale 提示词相关性#

cfg scale 是图像与提示词的契合度,该值越高,提示词对最终生成结果的影响越大,契合度越高。
过高的 CFG Scale 体现为粗犷的线条和过锐化的图像

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值