论文:Generalized Intersection over Union: A Metric and A Loss for Bounding Box Regression(CVPR 2019)
疑问
Faster RCNN只针对正样本回归,IoU都相对较高,IoU=0的情况不存在吧???
动机
以 Loss 为切入点,寻找更合适的 Loss 提升回归部分训练效果。
其实也就是要找到一个指标能灵敏地反应预测框的好坏(与目标框差别大不大),一般可以用 IoU 作为指标判断,该指标有以下特性:
- IoU 越大反应了预测框相对越准
- 对目标尺度不敏感(直接用目标框长宽和顶点坐标则对目标尺度敏感)
但是下列情况下,IoU就不能直接反应预测框的好坏:
- 当几个预测框均和目标框没有交集时(IoU=0),就不能对其进行区分
- 对齐方式不同,但 IoU 相同的情况,如下图:
GIoU
GIoU 融合 IoU 这个比较直接的指标的同时,还考虑了非重合区域,克服该指标上述不足,如上图:通过GIoU这个指标可以认为左边的预测框更好,这也较为符合直观感受
C
C
C 为包含
A
A
A、
B
B
B 的 最小矩形,
∣
C
(
A
∪
B
)
∣
|C\ (A\cup B)|
∣C (A∪B)∣ 表示
C
C
C 除去
A
A
A、
B
B
B 的并集
IoU Loss 和 GIoU Loss
10K个2D随机样本上测试
实验
用IoU Loss和GIoU Loss代替 YOLO算法和Faster R-CNN 等回归部分的 MSE,网络表现均有提升,GIoU 提升幅度相对更大