前言
《Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression》发表于2019年CVPR,来自斯坦福
资源
论文下载:
Generalized Intersection over Union: A Metric and A Loss for Bounding Box
Regression
Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
IOU的介绍
上图可知,图(a)采用
l
2
l_2
l2范式,图(b)采用
l
1
l_1
l1范式来定义两个框之间的差距,
其中绿边框的是
G
r
o
u
n
d
T
r
u
t
h
Ground\ Truth
Ground Truth,黑边框是
B
o
u
n
d
i
n
g
b
o
x
Bounding\ box
Bounding box。
图(a)取
G
r
o
u
n
d
T
r
u
t
h
Ground\ Truth
Ground Truth和
B
o
u
n
d
i
n
g
b
o
x
Bounding\ box
Bounding box两个框右上角的
l
2
l_2
l2范式作为预测度量,显然图(a)三种预测情况的
l
2
l_2
l2范式均相同,但是他们的IOU明显不同。
同样的论证可以扩展到任何其他表述和loss,例如图(b)采用了 l 1 l_1 l1范式作为预测度量。(这里 l 1 l_1 l1范式参数是图(b)的预测框和真实框的坐标差的绝对值之和,坐标为xcenter,ycenter,w,h)此时尽管图(b)三种预测情况都具有相同的 l 1 l_1 l1范式距离,但是他们的IOU明显不同。
从这里可以看出,在选了一个度量基准之后,相同度量却得到了不同的IOU,作者指出对于基于这些度量基准得到的良好的IOU值可能不一定是一个局部最优的IOU(与你选择的度量基准有关)
IOU也叫Jaccard index(雅各比指标),用于比较任意shape之间的相似性,IOU编码比较对象的形状属性(例如,两个边界框的宽高,位置)编码成区域属性并且计算了一个专注边界框的面积或体积的标准化的度量。这个属性使IOU对不同的问题规模具有不变性。由于这个令人感兴趣的属性,用于评估分割、目标检测和目标跟踪的所有性能都依赖于该指标。
作者指出,边界框的坐标参数表示(图(a)是四角坐标,图(b)是中心坐标+宽高坐标)对于最小化常用损失并没有强烈的相关性,
对于 l n − n o r m o b j e c t l_n-norm\ object ln−norm object的问题规模不是不变的。因此,几对具有相同重叠程度但具有不同尺度的边界框具有不同的客观价值。
此外,一些表示可能会缺乏正则化当这些表示用于表示不同类型的参数之间时。例如,图(b)的坐标表示(xcenter,ycenter,w,h),其中(xcenter,ycenter)是定义在位置空间的,而(w,h)是定义在尺寸空间的。
IOU同时作为一个指标,也作为一个loss时一个大问题,如果两个对象不重叠,则IOU值将为零,不会反映两个形状彼此多远。在这种情况下,在非重叠对象的情况下,如果IOU被用作损失,则其梯度将是零,不能优化。
这篇论文将问题扩展到边界框非重叠时的情况来讨论IOU的缺点,并提出了GIOU。
论文的主要贡献如下:
- 我们介绍了广义版本的IOU,作为比较任何两个任意形状的新指标
- 我们提供一种使用GIOU作为两个轴对齐举行或一般n-orthotopes的loss
- 我们将GIOU应用在目前最流行的目标检测算法,分析增益
相关工作
目标检测精度度量
当IOU作为评估度量时,必须选择精度阈值,例如Pascal VOC基于固定的IOU阈值,即0.5。然而IOU阈值的任意选择并没有完全反应不同方法的定位性能。我们认为任何高于这个阈值的定位精度都是等价的。为了使这种性能度量对IOU阈值不太敏感,MS COCO基准挑战赛采用了跨多个IOU阈值的MAP。
Generalized Intersection over Union(GIOU)
IOU
GIOU算法
如果
∣
A
∩
B
∣
=
0
|A\cap B|=0
∣A∩B∣=0,则
I
O
U
(
A
,
B
)
=
0
IOU(A,B)=0
IOU(A,B)=0。这种情况
I
O
U
IOU
IOU没有反应两边界框的远近关系。
从上图看出,IOU在非重叠样本的值一直为0,而GIOU的值小于0.
YOLOV3在Pascal VOC 2007的实验
YOLOV3在2014 validation set of MS COCO和the test set of MS COCO 2018的实验
Fast-RCNN的实验