《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》GIOU

前言

《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》发表于2019年CVPR,来自斯坦福

资源

论文下载:
Generalized Intersection over Union: A Metric and A Loss for Bounding Box
Regression

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

在这里插入图片描述

IOU的介绍

在这里插入图片描述
上图可知,图(a)采用 l 2 l_2 l2范式,图(b)采用 l 1 l_1 l1范式来定义两个框之间的差距,
其中绿边框的是 G r o u n d   T r u t h Ground\ Truth Ground Truth,黑边框是 B o u n d i n g   b o x Bounding\ box Bounding box
图(a)取 G r o u n d   T r u t h Ground\ Truth Ground Truth B o u n d i n g   b o x Bounding\ box Bounding box两个框右上角的 l 2 l_2 l2范式作为预测度量,显然图(a)三种预测情况的 l 2 l_2 l2范式均相同,但是他们的IOU明显不同。

同样的论证可以扩展到任何其他表述和loss,例如图(b)采用了 l 1 l_1 l1范式作为预测度量。(这里 l 1 l_1 l1范式参数是图(b)的预测框和真实框的坐标差的绝对值之和,坐标为xcenter,ycenter,w,h)此时尽管图(b)三种预测情况都具有相同的 l 1 l_1 l1范式距离,但是他们的IOU明显不同。

从这里可以看出,在选了一个度量基准之后,相同度量却得到了不同的IOU,作者指出对于基于这些度量基准得到的良好的IOU值可能不一定是一个局部最优的IOU(与你选择的度量基准有关)

IOU也叫Jaccard index(雅各比指标),用于比较任意shape之间的相似性,IOU编码比较对象的形状属性(例如,两个边界框的宽高,位置)编码成区域属性并且计算了一个专注边界框的面积或体积的标准化的度量。这个属性使IOU对不同的问题规模具有不变性。由于这个令人感兴趣的属性,用于评估分割、目标检测和目标跟踪的所有性能都依赖于该指标。

作者指出,边界框的坐标参数表示(图(a)是四角坐标,图(b)是中心坐标+宽高坐标)对于最小化常用损失并没有强烈的相关性,

对于 l n − n o r m   o b j e c t l_n-norm\ object lnnorm object的问题规模不是不变的。因此,几对具有相同重叠程度但具有不同尺度的边界框具有不同的客观价值。

此外,一些表示可能会缺乏正则化当这些表示用于表示不同类型的参数之间时。例如,图(b)的坐标表示(xcenter,ycenter,w,h),其中(xcenter,ycenter)是定义在位置空间的,而(w,h)是定义在尺寸空间的。

IOU同时作为一个指标,也作为一个loss时一个大问题,如果两个对象不重叠,则IOU值将为零,不会反映两个形状彼此多远。在这种情况下,在非重叠对象的情况下,如果IOU被用作损失,则其梯度将是零,不能优化。

这篇论文将问题扩展到边界框非重叠时的情况来讨论IOU的缺点,并提出了GIOU。

论文的主要贡献如下:

  • 我们介绍了广义版本的IOU,作为比较任何两个任意形状的新指标
  • 我们提供一种使用GIOU作为两个轴对齐举行或一般n-orthotopes的loss
  • 我们将GIOU应用在目前最流行的目标检测算法,分析增益

相关工作

目标检测精度度量

当IOU作为评估度量时,必须选择精度阈值,例如Pascal VOC基于固定的IOU阈值,即0.5。然而IOU阈值的任意选择并没有完全反应不同方法的定位性能。我们认为任何高于这个阈值的定位精度都是等价的。为了使这种性能度量对IOU阈值不太敏感,MS COCO基准挑战赛采用了跨多个IOU阈值的MAP。

Generalized Intersection over Union(GIOU)

IOU

在这里插入图片描述

GIOU算法

在这里插入图片描述
如果 ∣ A ∩ B ∣ = 0 |A\cap B|=0 AB=0,则 I O U ( A , B ) = 0 IOU(A,B)=0 IOU(A,B)=0。这种情况 I O U IOU IOU没有反应两边界框的远近关系。
在这里插入图片描述

在这里插入图片描述
从上图看出,IOU在非重叠样本的值一直为0,而GIOU的值小于0.

YOLOV3在Pascal VOC 2007的实验

在这里插入图片描述
在这里插入图片描述

YOLOV3在2014 validation set of MS COCO和the test set of MS COCO 2018的实验

在这里插入图片描述

Fast-RCNN的实验

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Mask-RCNN的实验

在这里插入图片描述

总结

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值