自定义保持图片宽高比例的resize函数

在深度学习中,在将图片输入模型之前,一般会进行resize操作,如果直接使用cv2.resize(img,size)函数,可能会导致图片变形,从而引起模型推理错误,需要自定义一个能够保持图片宽高比例的resize函数

代码

def make_image(frame, img_size):
    img = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    img = ratio_preserving_resize(img, img_size)
    return img

def ratio_preserving_resize(image, img_size):
    # ratio preserving resize
    img_h, img_w = image.shape
    scale_h = img_size[1] / img_h
    scale_w = img_size[0] / img_w
    scale_max = max(scale_h, scale_w)
    new_size = (int(img_w * scale_max), int(img_h * scale_max))
    image = cv2.resize(image, new_size, interpolation=cv2.INTER_LINEAR)
    
    # pad the image if necessary
    pad_height = math.ceil(max(0, img_size[1]-new_size[1])/2)
    pad_width = math.ceil(max(0, img_size[0]-new_size[0])/2)
    padded_image = cv2.copyMakeBorder(image, pad_height, pad_height, pad_width, pad_width, cv2.BORDER_CONSTANT,value=(0,0,0) )
    
    # center crop
    x = padded_image.shape[1] // 2 - img_size[0] // 2
    y = padded_image.shape[0] // 2 - img_size[1] // 2
    image = padded_image[y:y + img_size[1], x:x + img_size[0]]
    
    return image

测试结果

输入的图片:

1、使用opencv提供的resize函数
img_raw = cv2.imread("./001.png")
img_size = (640, 480)

img = cv2.cvtColor(img_raw, cv2.COLOR_BGR2GRAY)
img = cv2.resize(img,img_size)

win_name = 'Test Resize'
cv2.namedWindow(win_name, cv2.WINDOW_FREERATIO)
while(True):
    cv2.imshow(win_name, img)
    key = cv2.waitKey(delay=1)
    if key == ord('q'):
        print('Quitting, \'q\' pressed.')
        break
cv2.destroyAllWindows()

 

2、使用自定义的 ratio_preserving_resize函数
img_raw = cv2.imread("./001.png")
img_size = (640, 480)

img = make_image(img_raw.copy(), img_size)
    
win_name = 'Test Ratio Preserving Resize'
cv2.namedWindow(win_name, cv2.WINDOW_FREERATIO)
while(True):
    cv2.imshow(win_name, img)
    key = cv2.waitKey(delay=1)
    if key == ord('q'):
        print('Quitting, \'q\' pressed.')
        break
cv2.destroyAllWindows()

  • 7
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在 YOLOv5 中,可以通过更改 `--img-size` 参数来自定义抽取图片比例。该参数指定了输入图像的大小,它是一个正整数,代表了图像的较长边的像素值。例如,如果将 `--img-size` 设置为 640,则输入图像将被调整为 640x360 或 360x640 的大小,具体取决于原始图像的长宽比。 如果想要自定义抽取图片比例,可以根据实际需求设置 `--img-size` 参数的值。较大的值会导致更高的检测精度,但也会增加计算成本。因此,需要在精度和速度之间进行权衡,并选择最适合任务需求的参数值。 ### 回答2: 在YOLOv5中,我们可以通过修改数据集的预处理函数自定义抽取图片比例。YOLOv5使用的预处理函数是convert(),它负责将输入图片转换为模型接受的格式。在这个函数中,我们可以通过调整resize参数来更改抽取图片比例resize参数控制图片调整大小的方式,它可以是一个元组或一个整数。当resize是一个整数时,它表示图片的最长边的像素值大小,短边将会根据原始长宽比进行调整。当resize是一个元组时,它表示图片的目标长宽大小,将会缩放图片使其适应这个目标大小。 例如,如果我们想要抽取的图片大小为(416, 416),我们可以将resize设置为(416, 416),这样所有的图片都会被缩放到这个大小。如果我们想要根据图片的长边进行缩放,可以将resize设置为一个整数,如416,这样所有的图片都会按照416的最长边进行调整。 通过自定义resize参数,我们可以根据实际需求来决定抽取图片比例。更大的图片大小可能会导致更长的训练时间和更大的内存需求,而较小的图片则可能会影响模型的检测性能。因此,在自定义抽取图片比例时需要权衡这些因素,并选择合适的大小以保证模型的效果和效率。 ### 回答3: 在YOLOv5中,可以通过修改源代码中的`--img-size`参数来自定义抽取图片比例。`--img-size`参数决定了输入图像的尺寸,即模型训练和推理过程中处理的图像大小。 在YOLOv5中,默认的`--img-size`参数为640,即输入图像的大小为640x640像素。如果想自定义抽取图片比例,可以将`--img-size`参数设置为不同的值。 举例来说,如果将`--img-size`参数设置为800,那么输入图像的大小将变为800x800像素。这样可以在一定程度上提高检测的准确性,因为图像分辨率的提高有助于模型捕捉更多的细节。 然而,需要注意的是,随着`--img-size`的增加,模型的推理速度也会下降,因为需要处理更大的图像。因此,在自定义抽取图片比例时,需要在准确性和速度之间做出权衡。 总之,通过修改YOLOv5中的`--img-size`参数,我们可以自定义抽取图片比例,以满足不同需求的准确性和速度要求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值