前言
目标检测中,卷积网络训练时的图片通常是要求固定尺寸大小的图片(例如416*416),但是直接将图片进行resize处理会引起图片一定程度上的失真,如下图。
一种有效的方法是将图片长宽等比例缩放至所需尺寸,剩余部分利用padding进行填充,以解决图像失真问题。
代码
from PIL import Image
def letterbox_image(image, size):
# 对图片进行resize,使图片不失真。在空缺的地方进行padding
iw, ih = image.size
w, h = size
scale = min(w/iw, h/ih)
nw = int(iw*scale)
nh = int(ih*scale)
image = image.resize((nw,nh), Image.BICUBIC)
new_image = Image.new('RGB', size, (128,128,128))
new_image.paste(image, ((w-nw)//2, (h-nh)//2))
return new_image
img = Image.open("123.jpg")
new_image = letterbox_image(img,[416,416])
new_image.show()
其中:image为数据集中的图片,size为卷积神经网络输入需要的尺寸
该方法的思想为:
- 计算等比缩小的系数
- 将原图像乘以系数等比缩小
- 将剩余部分进行填充