论文链接: Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression
背景&问题:
IoU是目标检测领域用来衡量目标是否精确定位的指标。我们用L1、L2 loss回归得到bbox,计算IoU。但是目前的方案存在如下问题:
-
L1 L2 Loss不能准确度量IoU是否回归正确:不同IOU对应相同的L1/L2 Loss
-
IoU对旋转不敏感(垂直图像投影平面的旋转)
-
IoU对det和gt检测框不重合的情况无法优化
解决方案:使用广义的IoU,即GIoU:
A 、 B 是 我 们 的 d e t 和 g t 的 b b o x , C 是 他 们 的 矩 形 闭 包 A、B是我们的det和gt的bbox,C是他们的矩形闭包 A、B是我们的det和gt的bbox,C是他们的矩形闭包
G I o U = I o U − ∣ C ( A ∪ B ) ∣ ∣ C ∣ GIoU = IoU - \frac{|C\\(A \cup B)|}{|C|} GIoU=IoU−∣C∣∣C(A∪B)∣
L G I o U = 1 − G I o U L_{GIoU} = 1 - GIoU LGIoU=1−GIoU
GIoU优势
- 保留IoU的特性
- 对解决垂直图像投影平面的旋转不敏感问题
效果
-
YOLOv3
-
Faster-RCNN
-
MaskRCNN
展望
还有一些问题
- 其他方向处理不了,比如警察绕原地转圈