stable diffusion学习笔记【2023-10-2】

Stupid小池

已于 2023-10-02 17:37:47 修改

阅读量2.1k

点赞数 1

文章标签： stable diffusion 学习笔记

于 2023-10-02 17:36:27 首次发布

iamzchi

本文链接：https://blog.csdn.net/weixin_44986776/article/details/133136158

版权

本文探讨了AI技术在艺术创作中的应用，如CFGScale的提示词相关性处理、Denoisingstrength的重绘幅度调整、大模型（如Lora和HuggingFace）的下载与使用，以及高清修复技术（如R-ESRGAN4x）的细节。还涉及了图生文、控制网络（controlNet）和局部重绘（inpaint）等工具的参数与功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

L1：界面

CFG Scale：提示词相关性
denoising：重绘幅度

L2：文生图

女性常用的负面词
nsfw,NSFW,(NSFW:2),legs apart, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, (outdoor:1.6), manboobs, backlight,(ugly:1.331), (duplicate:1.331), (morbid:1.21), (mutilated:1.21), (tranny:1.331), mutated hands, (poorly drawn hands:1.331), blurry, (bad anatomy:1.21), (bad proportions:1.331), extra limbs, (disfigured:1.331), (more than 2 nipples:1.331), (missing arms:1.331), (extra legs:1.331), (fused fingers:1.61051), (too many fingers:1.61051), (unclear eyes:1.331), bad hands, missing fingers, extra digit, (futa:1.1), bad body, NG_DeepNegative_V1_75T, pubic hair, glans, refraction, diffusion, diffraction, nude, open mouth, teethï¼Œ(worst quality, low quality:1.4), bad anatomy, low quality lowres, low quality lowres low polygon 3D game, low quality lowres monochrome sketch rough graffiti, low quality lowres very ugly fat obesity scar, low quality lowres chibi, low quality lowres poorly drawn bad anatomy, low quality lowres graffiti unbecoming colorfully, low quality lowres incoherent background, low quality lowres long body, low quality lowres duplicate comparison, low quality lowres sketch retro_artstyle doujinshi, low quality lowres sketch, low quality lowres text font ui error missing digit blurry, low quality lowres JPEG artifacts signature hazy bleary, low quality lowres monochrome parody meme, low quality lowres historical picture, low quality lowres disfigured mutated malformed twisted human body, low quality lowres futanari tranny, low quality lowres tentacle skeleton,watermark, signature, fewer digits, figure, nude, topless, fat,lace,rabbit,big boobs,big breast

提示词思路

请添加图片描述

权重

在这里插入图片描述

采样步数20步以后提升效果不大
采样算法带加号的是改进过的算法，更稳定
提示词帮写网站
提示词和作品分享网站另一个替代的
分辨率起始为512，设置太高会出现多人问题，解决办法是使用high-resolution fix（hires fix）来提高分辨率，内容就会更加精细

L3：图生图

Denoising strength 重绘幅度参数：与原图差别多大
随机种子：筛子-1即随机生成；循环按钮将返回上一张图的种子，按照上一张图的样子再次生成。

L4：大模型

下载大模型的网站：
- https://huggingface.co/
- https://civitai.com/
一些后缀的分类：
- checkpoint 大模型
- Lora：从模型网站上下载到的很多模型属于lora，要把他们放在model/Lora文件夹下，相当于一个附加修改器，需要以其他模型为基础
大模型分类
- trained：一手，原创的
- merge：模型混合的，名字里一般都有mix

模型风格：
在这里插入图片描述
up推荐的：

L5：提高产图质量

高清修复

一种说法：hires.fix中的算法R-ESRGAN 4x+对真实图来说更有细节（但其实还是需要多尝试

SD放大

安装extension的方法
在img2img中的script找到对应脚本，注意需要设置重叠像素（tile）的宽高
在这里插入图片描述

附加功能放大

其实就是一个重绘幅度为0的放大，只会精细描线，并不会增加细节

L6：修改器

embedding词嵌入

原理：相当于给一个指示，按照某个人物特点来进行生成，c站的模型筛选中可以找到
使用方法：下载后放入embedding文件夹，在提示词中填入模型详情中的Trigger Words即可。注意看作者说的应该填入哪种提示词
应用：

画某个角色的同人二创（其实更多用lora
经典应用：转身图（具体使用的时候应参考wiki
画手。记录了一些手的错误案例，下次ai绘图会避开这些错误案例。

图生文

主要是img2img中的图像反推 (Interrogate) 提示词算法 (BLIP 和 DeepBooru)
生成比较慢

效果差异
比如某张照片：

BLIP

a man with no shirt and no shirt on is standing in front of a wall with his shirt off, Benjamin Marra(一个美漫艺术家), cel shading(一种三渲二的方法), a comic book panel(一个漫画面板), cobra(未找到来源)

DeepBooru（速度更快）

1boy, abs, bara(一种同性艺术风格), beach, dark-skinned male, goggles(护目镜), male focus, male swimwear, muscular, muscular male, navel（肚脐）, nipples（r头）, pectorals（胸脯）, shorts, solo, sunglasses, toned（强壮）, topless male

LORA

添加了针对LADY GAGA的角色特点，二创更多用lora
注意看有的lora的详情里面也写了推荐的trigger words

超网络hypernetwork

一般用于改变画风（有时可被lora取代
使用方法：
下载后放在\models\hypernetworks
在超网络标签中，刷新，选中即可

L7：局部重绘inpaint

参数解释：

蒙版：就是涂黑的那一部分
蒙版模糊度：类似ps的羽化
mask mode：正选反选
masked content：
Fill: 基于模糊选区
Original: 基于原图（大多数情况会选这个
Latent Noise: 随机图像，如果想要随机生成这个选区就勾选这个选项
Latent Nothing: 基于纯色块选区，色块是选区附近像素的平均色
Inpaint area
全图/Whole picture：绘制全图再拼接回去你提供的图
仅蒙版/Only masked：只重绘选区内容，容易出错
inpaint和inpaint sketch似乎没有区别…

L8：扩展

介绍和安装了一些好用的扩展

中文
tag提示
中文tag
image browser
Tagger：一种更好用的图生文
adetailer：修复人脸/手
infinite zoom：生成无线循环的视频

L9：Lora

在这里插入图片描述

L10：controlNet

可以用于控制人物姿势
需要将controlNet的扩展装在扩展文件夹下面
模型放在controlNet下的models中

参数：

控制权重/Control Weight：决定这个控制效应在图片中呈现出来的程度
启动控制的步数/Starting Control Step和结束控制的步数/Ending Control Step：controlnet什么时候生效，0-1代表全程生效
完美匹配像素/Pixel Perfect：无脑勾选
爆炸按钮：只生成动作的骨骼图

常用的controlnet的一些细节：

pose：预处理中的openpose_full可以精确定位包括表情、手指、躯干所有内容，其他都是部分内容
Depth：用于画场景、透视。生成一个空间深度图。【有时候openpose无法生成的动作，可可以试试depth】
canny：边缘检测，注重对细节的重现。
- 据说可以用于线稿上色
- 效果：（很想试试2333 - 要求精准重现某种事物（比如文字、汽车等等- sofe eage:同样边缘检测，但是只保留大概轮廓，canny更注重细节。