GIOU:Generalized Intersection over Union 论文解读

最新推荐文章于 2023-04-16 15:22:00 发布

守拙的冰淇淋

最新推荐文章于 2023-04-16 15:22:00 发布

阅读量801

点赞数 2

分类专栏：目标检测论文解读文章标签：目标检测

本文链接：https://blog.csdn.net/ff007_ok/article/details/88699777

版权

目标检测论文解读专栏收录该内容

1 篇文章 0 订阅

订阅专栏

作者没有对网络结构进行改进，反而是从一个特殊的视角来考虑目标检测的改进点——使用基于IOU的度量来代替传统回归的损失。想法新颖，论文讲解很详细，被CVPR2019收录。作者的主要贡献是：

提出了IOU的通用版本——GIOU，作为比较两个任意形状的新指标；
提供了将GIOU作为二维坐标框对齐时的loss方案；
主要在Faster/Mask RCNN与YOLO v3上面进行试验，证明在two-stage与one-stage上面均表现很好。

Motivation

Bounding box回归是2D/3D视觉任务总的基础模块，目标检测、实例分割等等，都需要bbox回归来获得较为准确地定位。目前来讲，想要获得更好的检测效果，要么使用重的backbone，要么设计更好的网络结构。但是这两种方案都忽略了bbox regression中基于IOU计算度量的L1/L2 loss。

IOU是目标检测中的一个重要的概念，在anchor机制中，IOU的作用不仅仅在于确定正负样本（0.5），还可以用来评价预测框和真实框之间的距离。IOU有一个很好的特性就是对尺度不敏感（scale-invariant）。在回归的任务中，判断pre-bbox与gt-bbox离最直接的指标就是IOU，但是所采用的loss函数却不太适用，如下图所示：

假设两个框的某一个角之间的距离是固定的，相同的L2-norm值相同，而其IOU值可以是完全不同的。因此，一个好的局部优化解未必是IOU的局部优化解。

Method

本文提出了使用IOU来指导回归任务的学习，在这种情况下，IOU可以被反向传播。然而，将IOU作为损失由两个问题：1）如果IOU=0，并不能反映出两个BBOX之间的距离（临近还是相离很远），梯度将为0，无法优化；2）IOU无法正确区分两个对象的不同align，即如果对齐方式不同，但是交叉区域相同的话，其IOU将完全相等。

针对上述IOU两点问题，作者提出改进方案：GIOU。

先计算两个框的最小闭包区域面积C，再计算IOU，然后再计算C区域中不属于两个框的区域占C的比重，最后用IOU减去这个比重得到GIOU。

与IOU相似，GIOU也是一种距离度量；对尺度不敏感；GIOU是IOU的下界；GIOU=[-1,1]；GIOU不仅仅关注重叠区域，还关注其他的不重合区域。

将GIOU作为损失函数，步骤如上图所示。

Experiment

作者将YOLO v3、Faster/Mask RCNN作为benchmarks来验证提出的方法，证明了不论是one-stage还是two-stage，GIOU对于检测效果都有提升。下图是在COCO数据集上的实验结果对比图：

YOLO v3涨幅比较明显，这是因为Faster/Mask RCNN中anchors很密集，GIOU发挥的作用的情况不多。后续会将我自己的实现release出来。

守拙的冰淇淋

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
GIOU:Generalized Intersection over Union 论文解读

作者没有对网络结构进行改进，反而是从一个特殊的视角来考虑目标检测的改进点——使用基于IOU的度量来代替传统回归的损失。想法新颖，论文讲解很详细，被CVPR2019收录。作者的主要贡献是：提出了IOU的通用版本——GIOU，作为比较两个任意形状的新指标；提供了将GIOU作为二维坐标框对齐时的loss方案；主要在Faster/Mask RCNN与YOLO v3上面进行试验，证明在two-s...
复制链接

扫一扫