Stable diffsuion基础篇(2)

前言:

基础篇会分4个章节来记录(如果能记录完的话,不想帖子的篇幅太长,太费时间),主要介绍整个stable diffusion的页面参数以及功能,文生图和图生图等等,最后一个章节会记录如何部署本地stable diffusion webui和云端的stable diffusion webui,以及还有插件的几种安装方式。

Stable diffusion webui 页面介绍

文生图参数区

1.采样方法&采样器

采样器(sampler)在 Stable Diffusion 中,是一种算法,用于从潜在空间中逐步生成图像。

采样器的核心原理是基于扩散模型的反向扩散过程。扩散模型通过多次迭代,从噪声图像逐步去噪,生成逼真的图像。每个采样器使用不同的算法和策略来实现这一过程。

翻译成人话就是:sd在生成图片的时候,首先会随机生成一个噪声图,然后我们选择了什么样的采样方法,他就会用什么样的采样方法去帮我们去噪,最后逐步生成我们想要的图片。

各式各样的采样方法太多,在这里我总结了一下目前主流使用的👇

Euler、Euler a :快速获得不错的结果 20~40步

DPM++ 2M Karras:推荐的算法,速度快,质量好,推荐步数 20~30 步

DPM++ SDE Karras:图像质量好但是不收敛,速度慢,推荐步数 15~20步

DPM++ 2M SDE Karras:2M和SDE的结合算法,速度和2M相仿,推荐步数 20~30 步

2.迭代步数

在使用Stable Diffusion模型生成图像的过程中,迭代步数(Iterations or Steps)指的是模型从初始噪声图像逐步优化、去噪直至生成最终图像的步骤数量。每一步都涉及对图像的逐步细化和调整,以从随机噪声中提取出高质量的图像。

图像质量:更多的迭代步数通常意味着模型有更多的机会细化图像,去除噪声,生成更高质量和更细腻的图像。

生成速度:较少的迭代步数会加快图像生成的速度,但可能会牺牲图像的质量和细节。

总结:根据测试的结果来看,一般的步数在15~50左右,太低会降噪有遗留或者图片生成扭曲,太高会增加其他额外的奇怪的细节。

3.高分辨率修复

高分辨率修复(High-Resolution Fix)是 Stable Diffusion 生成图像过程中的一种技术,旨在通过分阶段处理图像的方式提高最终图像的分辨率和细节。具体来说,这种技术通常涉及先生成较低分辨率的图像,然后逐步增加图像的分辨率,在每个阶段都对图像进行修复和优化,以生成更高质量的最终图像。

作用:提高图像质量,增强图像的细节和清晰度,减少模糊和噪点。 

高分迭代步数:如果不设置,会自动根据上面的迭代步数运行。

重绘幅度:数值越低,会越接近原图,数值越高,图片生成越发散。

放大算法(推荐):

写实:R-ESRGAN 4x+

漫画:R-ESRGAN 4x+ Anime6B

室内设计等等:4x-UltraSharp

放大倍数:1~4倍,倍数越高,运行需要的显存越高(注意设备的显存)

宽高调整:不用自己调整,系统根据倍数调整

额外话:sd训练的参数是根据512*512来训练的,所以在生成一些中远景图片的时候有时候分辨率不够用,给到脸或者手部的分辨太少,会导致模糊变形,这个时候可以用到高清修复。

4.refiner

在图像生成领域,Refiner(精炼器)是一个用于对初步生成的图像进行进一步优化和细化的模型或算法。它通常在初始生成模型之后运行,以提高图像的细节、质量和视觉效果。

实际上refunei是SDXL版本用的。

模型:在选择初始模型生成之后,选择另一个模型对图片进行优化。

切换时机:即初始模型生成到百分之几,优化模型开始运行(一般是选择0.7-0.8)。

5.宽高度、总批次数、单批数量

宽度和高度(Width and Height)是描述图像尺寸的基本属性,表示图像在水平方向和垂直方向上的像素数。它们共同决定了图像的分辨率和视觉效果。

宽度(Width):图像从左到右的像素数。

高度(Height):图像从上到下的像素数。

宽高度共同决定文件的分辨率和图片的大小。

建议: SD1.5:512X512、512X768,SDXL:1024X1024、1216X832、1280X768

总批次数:点击生成按钮后Stable Diffusion生成图像的次数。

单批数量:每次生成时,同时生成多少张图像。调高这个参数会消耗非常大的显存。(不建议)

6.提示词引导系数(CFG)

提示词引导系数(Classifier-Free Guidance Scale,简称 CFG)是Stable Diffusion中的一个重要参数,用于控制生成图像时对提示词的依赖程度。通过调整 CFG,可以平衡模型生成图像时对提示词的严格遵循和生成图像的多样性。

1.较高的 CFG 值会使生成图像更严格地遵循提示词,从而生成更加符合提示词描述的图像。

2.较低的 CFG 值会增加生成图像的多样性,使生成的图像可能与提示词的匹配度较低,但更加多样和富有创造性。

低 CFG 值(例如 3-7):

适用于需要更高创造性和多样性的生成任务。图像可能与提示词匹配度较低,但会更具变化和创造力。

中等 CFG 值(例如 7-10):

适用于大多数任务,平衡图像质量和提示词一致性。

高 CFG 值(例如 10-15):

适用于需要严格遵循提示词描述的生成任务。图像将更加符合提示词,但减少一些创造性和多样性。

7.随机种子数

随机种子决定了初始的噪声图像。Stable Diffusion 通过逐步去噪,将图像从初始噪声变成符合提示词描述的事物。如果使用相同的种子和相同的其他参数,不使用祖先采样器,每次生成的图像都会相同。

将种子设置为 -1 意味着每次生成都会使用不同的随机噪声图像,从而生成不同的图像。

差异随机种子:这是你选择的一个附加种子值,用于在图像生成过程中引入变异,以生成稍有不同的图像。

差异强度:这个参数用于控制主随机种子与差异种子之间的平衡。设置为 0 时,完全使用主随机种子值;设置为 1 时,完全使用差异种子值。这个功能通常用于生成一组相似但略有不同的图像。

建议:如果你喜欢某张图像的大部分细节,但对某些特定细节不满意,可以使用差异种子来生成变体图像。

从宽度中调整种子、从高度中调整种子:

即使你使用相同的种子,如果更改了原来图像的尺寸,生成的图像也会发生变化。为了保证改变宽高后图像内容不发生变化,你可以:

1.调整原来宽度和高度,设置新图像的尺寸。

2.在“附加种子”菜单中,输入原始图像的宽度和高度(从宽度中调整种子、从高度中调整种子)。

3.将原始种子值放入种子输入框。

4.将变异强度设置为 0,以忽略变异种子的影响。

这里有点绕,我也是花了一点功夫来理顺。

生成区

1.无限生成&停止无限生成

1.在生成按钮点击右键,就会弹出这个显示,点击无限生成,sd就会一直出图。

2.终止无限生成,点击生成按钮的停止按键是没用的,需要同样在生成按钮点击右键,然后选择停止无限生成。

2.指向左下角箭头

作用:自动读取上一张图片的参数

(需要正反提示词框没有提示词再使用)

即在生成图片之后,即使清空了提示框的内容,点一下箭头就会恢复所有参数(个人觉得一般般,可能是我段位太低)

3.笔记本

作用:快速设置参数

例如去其他网站复制,回来点击粘贴

点击笔记本,把复制内容粘贴

点击之后,所有参数会自动同步到你的sd页面。

4.垃圾桶

作用:清空提示词(正反向提示词一起清空)

5.钢笔

作用:快速复制提示词到预设样式(保存好,点击名称就能使用)

出图区

1.文件夹图标

打开文件输出目录

2.内存卡图标

保存图像到指定目录

3.盒子图标

压缩文件到指定目录

4.画册图标

发送图像和生成参数到图生图选项卡

5.颜料板图标

发送图像和生成参数到局部重绘选项卡

6.三角形图标

发送图像和生成参数到后期处理选项卡

  • 29
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值