目标检测(yolo)中锚框的w和h用对数形式表示原因分析

目标检测(yolo)中锚框的w和h用对数形式表示原因分析

在阅读YOLO_v2的论文时,发现在计算锚框在图像原本位置的过程中,对tw和th做了e的幂指运算(如图)。这说明这两个参数是按照对数形式保存的,可是为什么要这样呢?

图


理论上讲,对线性的尺度做了一次非线性变换应该是为了解决锚框尺度的问题。正如论文中处理不同大小锚框的偏移时可能会选择开根号或者直接用IoU的计算来代替绝对数值的计算。

YOLO将图像用规定大小和数量的网格划分开来,每个网格检测网格内部自己的目标。而且每个网格可能预不止一个锚框,表示可能存在的目标位置和尺寸。

如果用绝对的像素表示位置,对于不同尺度的目标不绝对公平。小目标与大目标相比,其坐标和尺寸的变化幅度可能很小,这样模型难以准确地预测小尺度目标。

如果用对数形式来表示宽高。即便是小尺度的锚框也拥有了和大尺度锚框差别不大的敏感度。

这样,大家遵循类似的分布,在训练时可能利于提高网络的性能以及回归收敛的速度。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值