掌握Stable Diffusion操作技巧:让你的图像生成更出色

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


话不多说,直接上正文吧!


1. Stable Diffusion 基础操作

文生图
如图所示 Stable Diffusion WebUI 的操作界面主要分为:模型区域、功能区域、参数区域、出图区域。
1.txt2img 为文生图功能,重点参数介绍:
2.正向提示词:描述图片中希望出现的内容
3.反向提示词:描述图片中不希望出现的内容
4.Sampling method:采样方法,推荐选择 Euler a 或 DPM++ 系列,采样速度快
5.Sampling steps:迭代步数,数值越大图像质量越好,生成时间也越长,一般控制在 30-50 就能出效果
6.Restore faces:可以优化脸部生成
7.Width/Height:生成图片的宽高,越大越消耗显存,生成时间也越长,一般方图 512x512,竖图 512x768,需要更大尺寸,可以到 Extras 功能里进行等比高清放大
8.CFG:提示词相关性,数值越大越相关,数值越小越不相关,一般建议 7-12 区间
9.Batch count/Batch size:生成批次和每批数量,如果需要多图,可以调整下每批数量
10.Seed:种子数,-1 表示随机,相同的种子数可以保持图像的一致性,如果觉得一张图的结构不错,但对风格不满意,可以将种子数固定,再调整 prompt 生成

在这里插入图片描述

图生图
img2img 功能可以生成与原图相似构图色彩的画像,或者指定一部分内容进行变换。可以重点使用 Inpaint 图像修补这个功能:
1.Resize mode:缩放模式,Just resize 只调整图片大小,如果输入与输出长宽比例不同,图片会被拉伸。Crop and resize 裁剪与调整大小,如果输入与输出长宽比例不同,会以图片中心向四周,将比例外的部分进行裁剪。Resize and fill 调整大小与填充,如果输入与输出分辨率不同,会以图片中心向四周,将比例内多余的部分进行填充
2.Mask blur:蒙版模糊度,值越大与原图边缘的过度越平滑,越小则边缘越锐利
3.Mask mode:蒙版模式,Inpaint masked 只重绘涂色部分,Inpaint not masked 重绘除了涂色的部分
4.Masked Content:蒙版内容,fill 用其他内容填充,original 在原来的基础上重绘
5.Inpaint area:重绘区域,Whole picture 整个图像区域,Only masked 只在蒙版区域
6.Denoising strength:重绘幅度,值越大越自由发挥,越小越和原图接近
在这里插入图片描述

ControlNet
安装完 ControlNet 后,在 txt2img 和 img2img 参数面板中均可以调用 ControlNet。操作说明:
1.Enable:启用 ControlNet
2.Low VRAM:低显存模式优化,建议 8G 显存以下开启
3.Guess mode:猜测模式,可以不设置提示词,自动生成图片
4.Preprocessor:选择预处理器,主要有 OpenPose、Canny、HED、Scribble、Mlsd、Seg、Normal Map、Depth
5.Model:ControlNet 模型,模型选择要与预处理器对应
6.Weight:权重影响,使用 ControlNet 生成图片的权重占比影响
7.Guidance strength(T):引导强度,值为 1 时,代表每迭代 1 步就会被 ControlNet 引导 1 次
8.Annotator resolution:数值越高,预处理图像越精细
9.Canny low/high threshold:控制最低和最高采样深度
10.Resize mode:图像大小模式,默认选择缩放至合适
11.Canvas width/height:画布宽高
12.Create blank canvas:创建空白画布
13.Preview annotator result:预览注释器结果,得到一张 ControlNet 模型提取的特征图片
14.Hide annotator result:隐藏预览图像窗口
在这里插入图片描述

2. Prompt 语法技巧

文生图模型的精髓在于 Prompt 提示词,如何写好 Prompt 将直接影响图像的生成质量。
提示词结构化
Prompt 提示词可以分为 4 段式结构:画质画风 + 画面主体 + 画面细节 + 风格参考
1.画面画风:主要是大模型或 LoRA 模型的 Tag、正向画质词、画作类型等
2.画面主体:画面核心内容、主体人/事/物/景、主体特征/动作等
3.画面细节:场景细节、人物细节、环境灯光、画面构图等
4.风格参考:艺术风格、渲染器、Embedding Tag 等
在这里插入图片描述
提示词语法
1.提示词排序:越前面的词汇越受 AI 重视,重要事物的提示词放前面
2.增强/减弱:(提示词:权重数值),默认 1,大于 1 加强,低于 1 减弱。如 (doctor:1.3)
3.混合:提示词 | 提示词,实现多个要素混合,如 [red|blue] hair 红蓝色头发混合
4.+ 和 AND:用于连接短提示词,AND 两端要加空格
5.分步渲染:[提示词 A:提示词 B:数值],先按提示词 A 生成,在设定的数值后朝提示词 B 变化。如[dog🐱30] 前 30 步画狗后面的画猫,[dog🐱0.9] 前面 90%画狗后面 10%画猫
6.正向提示词:masterpiece, best quality 等画质词,用于提升画面质量
7.反向提示词:nsfw, bad hands, missing fingers……, 用于不想在画面中出现的内容
8.Emoji:支持 emoji,如 😍 形容表情,🖐 修饰手
在这里插入图片描述
常用提示词举例:
在这里插入图片描述

3. Stable Diffusion 提示词中译英插件

下载提示词中文扩展插件:

https://github.com/Physton/sd-webui-prompt-all-in-one.git

点击扩展--从网址安装--输入网址--点击安装--安装完成之后重启SD就可以了


总结

以上就是今天要讲的内容,本文仅仅简单介绍了SD的使用,而SD提供了大量能使我们快速便捷地处理图像的方法。

  • 32
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YJ676

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值