stable diffusion controlnet前处理中的图像resize

最新推荐文章于 2025-06-10 14:46:48 发布

ltshan139

最新推荐文章于 2025-06-10 14:46:48 发布

阅读量1.1k

点赞数 10

分类专栏： AIGC 文章标签： stable diffusion

本文链接：https://blog.csdn.net/avideointerfaces/article/details/138353307

版权

AIGC 专栏收录该内容

1 篇文章

订阅专栏

本文详细解释了SDcontrolnet应用中控制图像预处理过程中的resize函数，包括其在resize_image中的实现，detect_resolution参数的作用，以及如何保证输出图像尺寸为64的倍数。当使用pipe接口时，resize函数决定了图像的最终尺寸。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在SD controlnet应用中，一般都要先安装controlnet_aux，并在项目代码中import相关前处理模块，如下所示。

在对control image进行前处理（比如找边缘，人体特征点）之前，往往会图像进行resize，这个resize函数定义在controlnet_autx中util.py中，无论是scribble，还是openpse或其它功能，都会调用这段resize代码。同时如果调用pipe接口时没有显示指定图像生成的宽和高，那么生成的图像size将会基于control image前处理后的宽高值。所以这里重点讨论下controlnet前处理中的resize函数。

先上代码：

def resize_image(input_image, resolution):
    H, W, C = input_image.shape
    H = float(H)
    W = float(W)
    k = float(resolution) / min(H, W)
    H *= k
    W *= k
    H = int(np.round(H / 64.0)) * 64
    W = int(np.round(W / 64.0)) * 64
    img = cv2.resize(input_image, (W, H), interpolation=cv2.INTER_LANCZOS4 if k > 1 else cv2.INTER_AREA)
    return img

在前处理接口会有一个参数detect_resolution，其缺省值为512。它会传给上面resize函数的resolution。它会将宽或高的较小值设成512，然后对应的高或宽按原始图像等比例缩放。此外，还要对等比例缩放后的宽、高值进行微调确保能被64整除。所以即使原始control image的尺寸是一些比较随意的值，但是经过前处理后的size都会被整归成能被64整除的值。前面说过，如果pipe接口没有显示指定生成图像的宽和高，那么该规整值就是最终图像的生成尺寸。