IOU loss 尺度不敏感
IOU
交并比
GIOU
为什么要GIOU ?
作者敏锐观察到,相同的L2 Loss 具有不一样的回归效果。
而 IOU具有一个尺度不敏感的特性,根据当前的iou数值,可以体现出预测值与gt值的直接效果。
为什么不直接用IOU loss ?
1、因为不重叠时,IOU 为 0 ,梯度为0,无法反向传播,无法回归。
2、检测框与gt框有iou时,无法精确反映重合度大小,检测效果也有较大的差异。
GIOU 定义:
简单意思:
GIOU = IOU - 最小包庇框中的空区域占比。
当重叠时,最小包庇框中的空区域占比为0,
GIOU = IOU
在两个框无重合的情况下,IOU=0,减数为1,GIOU即为-1
GIOU除了关注重叠区域不同,还关注了非重叠区域,能够更好的反应重合度
DIOU
第一:最小化两个边界框中心点的归一化距离能否加快收敛。第二:如何在回归时,能够更好的描述重叠信息,同时使得回归更准确,更快速?
与GIoU loss类似,DIoU loss在与目标框不重叠时,仍然可以为边界框提供移动方向
当边界框完全匹配时,L_iou=L_giou=L_diou=0, 当相距很远时,L_giou=L_diou -> 2
DIoU loss可以直接最小化两个目标框的距离,而GIOU loss优化的是两个目标框之间的面积,因此比GIoU loss收敛快得多。
对于包含两个框在水平方向和垂直方向上这种情况,DIoU损失可以使回归非常快,而GIoU损失几乎退化为IoU损失
CIOU
DIOU解决了归一化两个中心点的距离从而加速收敛的问题,但是还未解决第二个问题,即如何在回归时能够更好的描述重叠信息
CIOU最终提升了很多,尤其是最后一项,CIOU然后使用DIOU-nms,效果相当棒。
总结
预测的bbox的三个重要的因素分别是,重叠面积、中心点距离和纵横比(长宽比)
IOU :尺度不敏感,无法解决不重叠问题
GIOU :考虑空白区域,解决不重叠问题。
DIOU :归一化中心点距离能否加速收敛问题
CIOU :解决回归重叠一致性问题。长宽比尽可能向真值。