论文:UnitBox: An Advanced Object Detection Network
出处:ACM MM 2016
一、背景
在目标检测任务中,回归任务很多都使用 L n L_n Ln Loss,如 L1、Smooth L1、L2 等,它们通常都是计算角点的距离来衡量 Loss 的大小,指导模型的训练。
L2 loss 的局限性:
- 对于不同质量的 anchor,可能得到相同的 L2 距离结果。
- L2 loss 对框的四个边分别优化,忽略了一个目标的四条边界之间的关系,可能导致一个框的某两条边非常准确,但另外的边误差很大。
- 对尺度非常敏感,大的 gt 框和其对应的 anchor 框可能距离较大,但相比框本身的大小来说这个距离较小,但模型会更注重大框的优化来拉低 Loss,忽略了一些小目标。

二、方法
本文提出了 IoU loss
L
I
o
U
=
−
l
n
(
I
o
U
)
L_{IoU}=-ln(IoU)
LIoU=−ln(IoU)
通常为了简便起见,也写作:
L
I
o
U
=
1
−
I
o
U
L_{IoU}=1-IoU
LIoU=1−IoU

IoU Loss 的优点:
- 收敛速度比 L2 loss 快也更稳定,如图 4 所示
- 对尺度的变化更加鲁棒,如图 5 所示,将图像 resize 成多个不同的尺度,IoU loss 表现的更稳定,而 L2 loss 不太稳定

4210

被折叠的 条评论
为什么被折叠?



