前言:
基础篇会分4个章节来记录(如果能记录完的话,不想帖子的篇幅太长,太费时间),主要介绍整个stable diffusion的页面参数以及功能,文生图和图生图等等,最后一个章节会记录如何部署本地stable diffusion webui和云端的stable diffusion webui,以及还有插件的几种安装方式。
Stable diffusion webui 页面介绍
文生图参数区
1.采样方法&采样器
采样器(sampler)在 Stable Diffusion 中,是一种算法,用于从潜在空间中逐步生成图像。
采样器的核心原理是基于扩散模型的反向扩散过程。扩散模型通过多次迭代,从噪声图像逐步去噪,生成逼真的图像。每个采样器使用不同的算法和策略来实现这一过程。
翻译成人话就是:sd在生成图片的时候,首先会随机生成一个噪声图,然后我们选择了什么样的采样方法,他就会用什么样的采样方法去帮我们去噪,最后逐步生成我们想要的图片。
各式各样的采样方法太多,在这里我总结了一下目前主流使用的👇
Euler、Euler a :快速获得不错的结果 20~40步
DPM++ 2M Karras:推荐的算法,速度快,质量好,推荐步数 20~30 步
DPM++ SDE Karras:图像质量好但是不收敛,速度慢,推荐步数 15~20步
DPM++ 2M SDE Karras:2M和SDE的结合算法,速度和2M相仿,推荐步数 20~30 步
2.迭代步数
在使用Stable Diffusion模型生成图像的过程中,迭代步数(Iterations or Steps)指的是模型从初始噪声图像逐步优化、去噪直至生成最终图像的步骤数量。每一步都涉及对图像的逐步细化和调整,以从随机噪声中提取出高质量的图像。
图像质量:更多的迭代步数通常意味着模型有更多的机会细化图像,去除噪声,生成更高质量和更细腻的图像。
生成速度:较少的迭代步数会加快图像生成的速度,但可能会牺牲图像的质量和细节。
总结:根据测试的结果来看,一般的步数在15~50左右,太低会降噪有遗留或者图片生成扭曲,太高会增加其他额外的奇怪的细节。
3.高分辨率修复
高分辨率修复(High-Resolution Fix)是 Stable Diffusion 生成图像过程中的一种技术,旨在通过分阶段处理图像的方式提高最终图像的分辨率和细节。具体来说,这种技术通常涉及先生成较低分辨率的图像,然后逐步增加图像的分辨率,在每个阶段都对图像进行修复和优化,以生成更高质量的最终图像。
作用:提高图像质量,增强图像的细节和清晰度,减少模糊和噪点。
高分迭代步数:如果不设置,会自动根据上面的迭代步数运行。
重绘幅度:数值越低,会越接近原图,数值越高,图片生成越发散。
放大算法(推荐):
写实:R-ESRGAN 4x+
漫画:R-ESRGAN 4x+ Anime6B
室内设计等等:4x-UltraSharp
放大倍数:1~4倍,倍数越高,运行需要的显存越高(注意设备的显存)
宽高调整:不用自己调整,系统根据倍数调整
额外话:sd训练的参数是根据512*512来训练的,所以在生成一些中远景图片的时候有时候分辨率不够用,给到脸或者手部的分辨太少,会导致模糊变形,这个时候可以用到高清修复。
4.refiner
在图像生成领域,Refiner(精炼器)是一个用于对初步生成的图像进行进一步优化和细化的模型或算法。它通常在初始生成模型之后运行,以提高图像的细节、质量和视觉效果。
实际上refunei是SDXL版本用的。
模型:在选择初始模型生成之后,选择另一个模型对图片进行优化。
切换时机:即初始模型生成到百分之几,优化模型开始运行(一般是选择0.7-0.8)。
5.宽高度、总批次数、单批数量
宽度和高度(Width and Height)是描述图像尺寸的基本属性,表示图像在水平方向和垂直方向上的像素数。它们共同决定了图像的分辨率和视觉效果。
宽度(Width):图像从左到右的像素数。
高度(Height):图像从上到下的像素数。
宽高度共同决定文件的分辨率和图片的大小。
建议: SD1.5:512X512、512X768,SDXL:1024X1024、1216X832、1280X768
总批次数:点击生成按钮后Stable Diffusion生成图像的次数。
单批数量:每次生成时,同时生成多少张图像。调高这个参数会消耗非常大的显存。(不建议)
6.提示词引导系数(CFG)
提示词引导系数(Classifier-Free Guidance Scale,简称 CFG)是Stable Diffusion中的一个重要参数,用于控制生成图像时对提示词的依赖程度。通过调整 CFG,可以平衡模型生成图像时对提示词的严格遵循和生成图像的多样性。
1.较高的 CFG 值会使生成图像更严格地遵循提示词,从而生成更加符合提示词描述的图像。
2.较低的 CFG 值会增加生成图像的多样性,使生成的图像可能与提示词的匹配度较低,但更加多样和富有创造性。
低 CFG 值(例如 3-7):
适用于需要更高创造性和多样性的生成任务。图像可能与提示词匹配度较低,但会更具变化和创造力。
中等 CFG 值(例如 7-10):
适用于大多数任务,平衡图像质量和提示词一致性。
高 CFG 值(例如 10-15):
适用于需要严格遵循提示词描述的生成任务。图像将更加符合提示词,但减少一些创造性和多样性。
7.随机种子数
随机种子决定了初始的噪声图像。Stable Diffusion 通过逐步去噪,将图像从初始噪声变成符合提示词描述的事物。如果使用相同的种子和相同的其他参数,不使用祖先采样器,每次生成的图像都会相同。
将种子设置为 -1 意味着每次生成都会使用不同的随机噪声图像,从而生成不同的图像。
差异随机种子:这是你选择的一个附加种子值,用于在图像生成过程中引入变异,以生成稍有不同的图像。
差异强度:这个参数用于控制主随机种子与差异种子之间的平衡。设置为 0 时,完全使用主随机种子值;设置为 1 时,完全使用差异种子值。这个功能通常用于生成一组相似但略有不同的图像。
建议:如果你喜欢某张图像的大部分细节,但对某些特定细节不满意,可以使用差异种子来生成变体图像。
从宽度中调整种子、从高度中调整种子:
即使你使用相同的种子,如果更改了原来图像的尺寸,生成的图像也会发生变化。为了保证改变宽高后图像内容不发生变化,你可以:
1.调整原来宽度和高度,设置新图像的尺寸。
2.在“附加种子”菜单中,输入原始图像的宽度和高度(从宽度中调整种子、从高度中调整种子)。
3.将原始种子值放入种子输入框。
4.将变异强度设置为 0,以忽略变异种子的影响。
这里有点绕,我也是花了一点功夫来理顺。
生成区
1.无限生成&停止无限生成
1.在生成按钮点击右键,就会弹出这个显示,点击无限生成,sd就会一直出图。
2.终止无限生成,点击生成按钮的停止按键是没用的,需要同样在生成按钮点击右键,然后选择停止无限生成。
2.指向左下角箭头
作用:自动读取上一张图片的参数
(需要正反提示词框没有提示词再使用)
即在生成图片之后,即使清空了提示框的内容,点一下箭头就会恢复所有参数(个人觉得一般般,可能是我段位太低)
3.笔记本
作用:快速设置参数
例如去其他网站复制,回来点击粘贴
点击笔记本,把复制内容粘贴
点击之后,所有参数会自动同步到你的sd页面。
4.垃圾桶
作用:清空提示词(正反向提示词一起清空)
5.钢笔
作用:快速复制提示词到预设样式(保存好,点击名称就能使用)
出图区
1.文件夹图标
打开文件输出目录
2.内存卡图标
保存图像到指定目录
3.盒子图标
压缩文件到指定目录
4.画册图标
发送图像和生成参数到图生图选项卡
5.颜料板图标
发送图像和生成参数到局部重绘选项卡
6.三角形图标
发送图像和生成参数到后期处理选项卡