【yolov5 trick1】训练阶段和推理阶段图像分辨率的处理方法

首先看github这一段话(链接https://github.com/ultralytics/yolov3/issues/232):

大致含义:比较yoloV3不同输入图像分辨率的推理时间,输入图像分辨率padded为32倍数的矩形框要比输入图像分辨率为等宽高的正方形框的推理时间提升了0.63倍。yoloV5采用了这一trick。

在常用的目标检测算法中,输入图像的分辨率大小不一,常用的方式是将输入图像的分辨率归一化为统一的图像分辨率,然后再喂给目标检测网络。

 

若设置喂给目标检测网络输入图像的分辨率为:416*416

 

目标检测算法训练阶段和推理阶段resize输入图像为416*416,例如原始输入图像为1280*720:

训练阶段的方法是:

 

原始输入图像宽高比:720/1280 = 0.5625

以长边为基准,缩放比例分别为:1,0.5625

等比例缩放后的分辨率为:416 ,234

训练阶段对等比例缩放后的分辨率进行pading:左右两列的列表分别pad = (416-234)/ 2 = 91,padding后的图像为:

推理阶段:

 

原始输入图像缩放后的分辨率(设定为32的倍数)为:(np.ceil(1*416/32)*32 ,np.ceil(0.5625*416/32 )*32) = (416,256)

 

原始图像等比例缩放后的分辨率为:(416,234)

 

分别对等比例缩放后的图像进行行列padding:

 

行pad = (416- 416)/2 =0   , 列pad = (256- 234)/2 = 11

因此推理阶段padding后的图像分辨率为:

训练阶段和推理阶段pading的像素值为(114,114,114)灰色像素或(0,0,0)黑色像素。

欢迎扫码关注:

  • 6
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 16
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值