GIoU（Generalized Intersection over Union）详解

汪老板的员工1228

已于 2022-11-23 21:30:38 修改

阅读量342

点赞数 1

分类专栏：深度学习重要底层模型及公式文章标签：目标检测深度学习

于 2022-11-22 22:27:09 首次发布

原文链接：https://blog.csdn.net/weixin_41735859/article/details/89288493

版权

深度学习重要底层模型及公式专栏收录该内容

4 篇文章 0 订阅

订阅专栏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。
本文链接：https://blog.csdn.net/weixin_41735859/article/details/89288493

Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression

一、动机：

在目标检测任务中，回归loss相同的情况下，IoU却可能大不相同。
如下图(a)所示：三张图有一样的L2距离，但是IoU值却完全不同。坐标表示方法为(x1,y1,x2,y2)。
图(b)为L1距离。坐标表示方法为(x,y,w,h)，x,y为中心点坐标。

IoU有尺度不变性的优点，但是将其作为损失函数，由于某些方面的问题，无法直接使用。

二、IoU的优点：

IoU作为距离时(比如： $L I o U = 1 - I o U$ )，是一个度量。因为它包含了作为度量的所有属性，比如：非负性，不确定性对称性和三角不等性。
IoU有尺度不变性，这意味着任意两个方框Ａ和Ｂ的相似性与他们的空间尺度的无关。

三、IoU同时作为度量和损失函数时，存在两个问题:

如果两个目标没有重叠，IoU将会为０,并且不会反应两个目标之间的距离，在这种无重叠目标的情况下，如果IoU用作于损失函数，梯度为０，无法优化。
IoU无法区分两个对象之间不同的对齐方式。更确切地讲，不同方向上有相同交叉级别的两个重叠对象的IoU会完全相等。

四、本文的主要贡献：

将GIoU作为比较任意两个边框的度量。
使用GIoU作为两个轴对齐矩形的的损失，并提供了解析解。
把GIoU损失加入到最流行的目标检测算法中(例如：Faster R-CNN，Ｍask R-CNN和YOLO v3)，并且展示了他们在标准目标检测基准中提高的性能。

五、GIoU:

对于任意的两个Ａ、B框，首先找到一个能够包住它们的最小方框Ｃ。然后计算C \ (A ∪ B) 的面积与Ｃ的面积的比值，注：C \ (A ∪ B) 的面积为C的面积减去A∪B的面积。再用Ａ、Ｂ的IoU值减去这个比值得到GIoU。

GIoU作为度量时的性能：

GIoU作为距离时， $L G I o U = 1 - G I o U$ ，非负性，不确定性，对称性以及三角不等性。
尺度不变性。
GIoU始终是IoU的下限，即GIoU(A,B) <= IoU(A,B)。当A,B形状相似，并且接近时， $l i m A \to B G I o U (A, B) = I o U (A, B)$ .
-1 ≤ GIoU(A,B) ≤ 1。A,B完全重合时，GIoU(A,B) = IoU(A,B) = 1. (A∪B)/C→0 时，也就是A∪B的面积相对于C可很小很小时，GIoU收敛于-1.
GIoU考虑到了 IoU 没有考虑到的非重叠区域，能够反应出 A,B 重叠的方式。

GIoU:

IoU和GIoU做为边框损失函数时的算法流程：

$B p$ :预测框　　　　　　 $B g$ :ground truth　　　　　 $B c$ :最小包围框
$A p$ :预测框面积　　　　 $A g$ :ground truth面积

输入预测框的 $(x 1 , y 1 , x 2 , y 2 ) 值$ 和 ground truth 的 $(X 1 , Y 1 , X 2 , Y 2 )$ 值。
将预测值排序：使得 $x 2 > x 1 , y 2 > y 1 $ 。
分别计算预测框的面积 $A p$ 和 ground truth 的面积 $A g$ 。
计算两者交集的面积 I .
找出最小包围框 $(x c 1 , y c 1 , x c 2 , y c 2 )$ .
计算IoU,GIoU
计算 $L I o U $ ， $L G I o U $

六、实验结果

所有对比实验中(网络：Faster R-CNN，Mask R-CNN and YOLOv3 / 数据集：PASCAL VOC, MS COCO)，加过IoU损失和GIoU损失的mAP都在原来的基础得到了提升，在此不一一分析。下图为检测效果图，从左往右分别为 $L G I o U $ , $L I o U $ ,网络原来的损失函数。实线为ground truth，虚线为预测框。
在这里插入图片描述

汪老板的员工1228

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GIoU（Generalized Intersection over Union）详解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/weixin_41735859/article/details/89288493。
复制链接

扫一扫

专栏目录