Stable Diffusion教程：额外功能/后期处理/高清化

最新推荐文章于 2024-06-05 10:15:27 发布

AI绘画小33

最新推荐文章于 2024-06-05 10:15:27 发布

阅读量1k

点赞数 11

文章标签： stable diffusion AI作画人工智能 AIGC

本文链接：https://blog.csdn.net/2401_84760527/article/details/138948630

版权

"额外功能"对应的英文单词是Extras，算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”，这都是意译，因为它的主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力，都是额外扩展的。

下面正式开始介绍“额外功能”的相关能力。

图片放大

先看最基本的图片放大能力。对于分辨率比较小的图片，如果强制用较大的分辨率展示，会出现图片模糊的情况，这时候就可以使用SD WebUI的图片放大功能。所谓图片放大就是在保持图片清晰度的前提下增加图片的分辨率，它还有个专业点的名词：超分辨率技术，简称为“超分”。

具体操作方式请参考下图：

1、主菜单中点击进入“额外功能”。

2、点击“单张图像”，也就是一次只处理一张图片。后边的“批量处理”可以上传多张图片进行处理，“批量处理目录下图像”可以指定处理一个目录下的所有图片。

3、点击上传一张要处理的图片。

4、选择缩放比例。这里有两种方式：按照比例缩放和指定分辨率缩放，指定分辨率时可以设置是否自动裁剪，都很好理解，试试就明白了。

5、Upscaler1用来指定放大算法，常见的放大算法有下面几个：

无/None：单纯的放大，不做任何优化处理。
Lanczos：使用加权平均插值方法，利用原始图像自身的像素信息，增加图像的细节，从而提高图像的分辨率。传统的纯数学算法，效果一般。
Nearest：使用简单的插值方法，基于最近邻像素的值进行插值，从而增加图像的细节和提高分辨率。传统的纯数学算法，效果一般，还不如 Lanczos 的效果好。
LDSR：基于深度学习，通过使用轻量级的网络结构和残差学习，实现较高的超分性能和计算效率。适用于各种需要快速且准确地提高图像分辨率的应用场景，如实时视频处理、移动设备图像处理等。
ESRGAN：全称Enhanced Super-Resolution Generative Adversarial Networks （增强超分生成对抗网络），基于深度学习的超分辨率算法。增加了很多看上去很真实的纹理，但是有时可能会过度拟合，出现不好的效果。
4x-UltraSharp：基于ESRGAN做了优化，比较适合处理真人。
ESRGAN_4x：Real ESRGAN，完全使用纯合成数据来尽量贴近真实数据进行训练。腾讯贡献。
R-ESRGAN 4x+：基于Real ESRGAN的优化模型，适合放大真实风格的图片，常用。
R-ESRGAN 4x+ Anime6B：基于Real ESRGAN的优化模型，适合放大动漫风格的图片，常用。
ScuNET GAN：基于深度学习，使用生成对抗网络（GAN）进行训练。主要用在提高图像的视觉效果和感知质量，例如在图像增强、视频处理等。
ScuNET PSNR：基于深度学习，使用均方误差（PSNR）进行训练。主要用在提高图像的客观质量和准确性，例如在医学图像分析、监控视频处理等。
SwinIR_4x：使用Swin Transformer思想，基于自注意力机制的Transformer结构，适合各种图像的超分，比较通用。

这些算法会在首次使用它们时分别下载，你也可以提前下载它们，并放到指定的目录。我整理的SD绘画资源中已经收集了这些文件，下载方式请看本文最后的部分。

6、Upscaler2 用来避免 Upscaler1 过度处理的问题，比如磨皮太严重。可以使用一些普通方法算法，比如 Lanczos。Upscaler2 可见度是指图片放大时使用 Upscaler2 算法进行处理的比例，为0时完全不使用 Upscaler2，为1时只使用 Upscaler2。

7、点击“生成”。

8、放大后的图片在这里显示。

小结

这个图片放大功能主要是为了放大 Stable Diffusion 生成的低分辨率图片，因为图片分辨率越大对显存的要求也越大，所以对于显存较小的同学，可以先在文生图中生成一张低分辨率图片，然后再在这里放大。

对于修复模糊图片，这个图片放大功能其实能力有限，实际测试 WebUI 默认自带的放大算法也就是能去去噪点，消消锯齿，出图的效果并不是很好，特别是原本就很糊的图片。

不过可能存在其它的算法具备较好的模糊图片修复效果，大家可以找来试试。

修脸

虽然图片放大本身对修复模糊图片的效果有限，但是它附带了一个修脸的参数。如果文生图生成的人脸效果不好，比如磨皮太严重、人脸变形等，都可以在这里试试。对于模糊的人脸，也有比较好的修复效果。

修脸方法支持两个模型：GFPGAN 和 CodeFormer，操作方法参见下图：

1、GFPGAN：腾讯开源的一个修脸模型，修复的细节比较清晰，人物形象的还原度比较高，气质保持的好。

2、CodeFormer：另一个修脸模型，修图的细节也比较清晰，皮肤纹理更真实一些，不过这个模型对牙齿的处理效果不好。这个模型还有一个面部重建权重的参数，取值范围0-1，0的时候模型会补充很多细节，面部改变较大；1的时候面部基本没有改变，不会补充很多细节，但是也有修脸的效果。

这两个模型可以一起使用，我们可以通过 GFPGAN visibility 和 CodeFormer visibility 来设置它们的参与度。

下面是几组示例。

1、原图是 Stable Diffusion 生成的，我用图片管理工具缩小了分辨率。可以看到，相比仅放大，加上修脸之后，人物的面部有了明显的改善。

2、这是一张从网上收集的图片，原图就是比较模糊的老照片，分别单独使用GPFGAN和CodeFormer的效果。GFPGAN的人物气质拿捏的比较到位，CodeFormer面部纹理更真实一些，但是不宜将重建权重值设置的过小。

3、这也是从网上收集的图片，这张照片破损比较严重，使用的GFPGAN模型，能修复一些破损。

这是一位SD资深大神整理的，100款Stable Diffusion超实用插件，涵盖目前几乎所有的，主流插件需求。

全文超过4000字。

我把它们整理成更适合大家下载安装的【压缩包】，无需梯子，并根据具体的内容，拆解成一二级目录，以方便大家查阅使用。

单单排版就差不多花费1个小时。

希望能让大家在使用Stable Diffusion工具时，可以更好、更快的获得自己想要的答案，以上。

如果感觉有用，帮忙点个支持，谢谢了。

想要原版100款插件整合包的小伙伴，可以来点击下方插件直接免费获取

100款Stable Diffusion插件：

面部&手部修复插件：After Detailer

在我们出图的时候，最头疼的就是出的图哪有满意，就是手部经常崩坏。只要放到 ControlNet 里面再修复。

现在我们只需要在出图的时候启动 Adetailer 就可以很大程度上修复脸部和手部的崩坏问题

AI换脸插件：sd-webui-roop

换脸插件，只需要提供一张照片，就可以将一张脸替换到另一个人物上，这在娱乐和创作中非常受欢迎。

模型预设管理器：Model Preset Manager

这个插件可以轻松的创建、组织和共享模型预设。有了这个功能，就不再需要记住每个模型的最佳 cfg_scale、实现卡通或现实风格的特定触发词，或者为特定图像类型产生令人印象深刻的结果的设置!

现代主题：Lobe Theme

已经被赞爆的现代化 Web UI 主题。相比传统的 Web UI 体验性大大加强。

提示词自动补齐插件：Tag Complete

使用这个插件可以直接输入中文，调取对应的英文提示词。并且能够根据未写完的英文提示词提供补全选项，在键盘上按↓箭头选择，按 enter 键选中

提示词翻译插件：sd-webui-bilingual-localization

这个插件提供双语翻译功能，使得界面可以支持两种语言，对于双语用户来说是一个很有用的功能。

提示词库：sd-webui-oldsix-prompt

提供提示词功能，可能帮助用户更好地指导图像生成的方向。

上千个提示词，无需英文基础快速输入提示词，该词库还在不断更新。

以后再也不担心英文写出不卡住思路了！

由于篇幅原因，有需要完整版Stable Diffusion插件库的小伙伴，点击下方插件即可免费领取

AI绘画小33

关注

11
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
Stable Diffusion教程：额外功能/后期处理/高清化

"额外功能"对应的英文单词是Extras，算是直译。但是部分版本中的翻译是“后期处理”或者“高清化”，这都是意译，因为它的主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里边对图片的处理不是 Stable Diffusion 本身的能力，都是额外扩展的。下面正式开始介绍“额外功能”的相关能力。
复制链接

扫一扫