[论文阅读]Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

分析

目标检测中,边界框回归是很重要的一个组成部分,判断一个边界框回归好坏,一般通过IOU来体现。

优化回归损失与优化IOU之间存在差距

分析一

然而在当前检测算法中,并不是直接优化IOU,而是将IOU decode成(x,y,w,h)或者边界框的两个角点 ( x 1 , y 1 , x 2 , y 2 ) (x_1,y_1,x_2,y_2) (x1,y1,x2,y2),对这几个值进行回归,从而优化IOU,然后实际上这几个值与IOU并不是完全的正相关关系。如下图所示:黑色矩形(预测框),绿色矩形(真实框),用两个角点表示 ( x 1 , y 1 , x 2 , y 2 ) (x_1,y_1,x_2,y_2) (x1,y1,x2,y2),在欧式距离和街区距离相等的情况下,他们的IOU却相差很大。

分析二

基于上述参数定义的范数(欧式距离和街区距离)对于物体的尺寸是敏感的。如果有几个具有相同重叠水平的边界框,但是由于不同尺度,则会产生不同的影响数值

分析三

一些不同类型表示的参数缺乏正则化,如(x,y,w,h)这种表示形式,xy反映了空间的关系,wh却反映了尺寸的关系。

为减少以上问题,目前先进的检测器提供了anchor box,用来提供良好的初始猜测,并定义一些表示来弥补尺寸的变化(如yolov1 宽高用开平方计算loss,v3前面则会有一个系数2-box面积),但即使有这些手动操作,优化回归损失与优化IOU之间还是会有差距

那我们为什么不直接优化IOU呢,有以下两个问题
(1)如果两个物体没有重叠,则IOU为0,不能反映两者的距离关系,无法进行梯度更新优化
(2)IOU区别不出来两个物体的对齐方式(如下图所示,三者具有相同的IOU,但是对齐方式不一样,明显平行对齐的那个框回归的更好,而使用GIOU从左到右分别为0.33,0.24,-0.1,GIOU越大则具有更好的对齐方向)
在这里插入图片描述
基于以上问题,提出GIOU

GIOU

在这里插入图片描述
计算步骤
(1)计算两个框的最小闭包面积
(2)计算IOU
(3)计算最小闭包中不属于两个框的面积 相对于 最小闭包面积的比重,并用IOU减去他 得到GIOU
GIOU有如下几个特点
(1)与IOU类似,GIOU也是一种距离度量,损失函数为1-GIOU
(2)与IOU类似,GIOU对尺度不敏感
(3)GIOU总是要比IOU要小,并且在两个边界框几乎重叠时,两者几乎没有差距。
(4)IOU的范围是0~1,但是GIOU有对称范围,属于-1 ~ 1
A:和IOU类似,值1表示两个边界框完全重合,即如果 ∣ A ⋂ B ∣ = ∣ A ⋃ B ∣ |A \bigcap B| =|A \bigcup B| AB=AB,那么GIOU=IOU=1
B:当两者并集占最小闭包集合比例趋于0时,GIOU为-1(即表示两个边框无限远,此时比例趋于0),即
l i m A ⋂ B C − > 0 G I O U ( A , B ) = − 1 lim_{\frac {A \bigcap B}{C}->0} GIOU(A,B) =-1 limCAB>0GIOU(A,B)=1
(5)与IOU不同的是,GIOU不仅仅关注两个边界框的重叠面积,当A与B之间没有很好重叠时,如本文第二章图片中的第三个矩形,最小闭包中除了两者并集之外的空白增加。GIOU就会变小,所以GIOU可以更好地反映两个物体如何发生发生重叠。
具体计算公式
在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值