Stable Diffusion 常用放大算法详解

培根芝士

已于 2024-09-14 18:41:56 修改

阅读量6.9k

点赞数 8

分类专栏： AI 文章标签：人工智能 stable diffusion

于 2024-04-26 16:30:41 首次发布

本文链接：https://blog.csdn.net/watson2017/article/details/138222436

版权

本文详细介绍了稳定扩散（Stable Diffusion）中的常用图像放大算法，包括传统插值算法如Lanczos、Nearest，以及AI图像放大算法如4x-UltraSharp和ESRGAN系列。推荐使用ESRGAN系列中的R-ESRGAN 4x+，针对写实图片和二次元图像分别推荐R-ESRGAN 4x+ Anime6B，以实现高质量的图像放大效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

常用放大算法

图像放大算法大致有两种：

传统图像放大算法（Lantent、Lanczos、Nearest）
AI图像放大算法（4x-UltraSharp、BSRGAN、ESRGAN等）

传统图像放大算法是基于插值算法，计算出图像放大后新位置的像素值。AI图像放大算法，比一般的传统图像放大算法效果更好。

推荐放大算法 ESRGAN系列和 4X-UltraSharp
R-ESRGAN 4x+ 适用于写实图片
R-ESRGAN 4x+ Anime6B 适用于二次元类图片或二三次元混合图片

Latent 系列（不常用）

Latent 系列放大算法是在潜空间对图像进行放大，然后重新采样来增加图像的细节。

此外由于不是对图像像素级别的直接放大操作，当高分迭代步数不够或者重绘幅度过低时，生成的图像会模糊或失真。

重绘幅度在0~0.5的时候放大生成的图像是模糊的，因此在使用 Latent 系列算法时，需要一定的重绘幅度，并且随着放大倍数的提高，放大的图像会变得扭曲。

不同 Latent 算法之间的区别。

Latent (antialiased)：结合抗锯齿 (antialiased) 技术来消除图像中的锯齿状边缘。
Latent (bicubic)：使用双立法插值 (bicubic) 算法来放大图像，其在每个像素的位置使用一个三次多项式来拟合周围16个邻近像素（4x4的像素网格）的值。该算法考虑了每个像素点与其周围像素点之间的非线性关系，从而能够更准确地模拟图像中复杂的灰度变化，使得图像更加细致。
Latent (bicubic antialiased)：结合双立法插值 (bicubic) 算法和抗锯齿 (antialiased) 技术，放大图像的同时消除锯齿状边缘，提高图像的分辨率和质量。
Latent (nearest)：使用最近邻插值 (Nearest Neighbor Interpolation) 算法来放大图像，其在放大图像后，对于新位置的像素直接采用最近的原图像像素作为其值。这导致新像素之间缺乏过渡，容易导致图像边缘出现明显的锯齿状或阶梯状效果，放

最低0.47元/天解锁文章