iou-net:
motivation:
iou在nms以及预测的时候依靠分类得分, 但是分类得分和iou并不是完全的线性相关
1、提出IOU-guided NMS,也就是在NMS阶段引入回归得分(localization confidence)作为排序指标而不是采用传统的分类得分。位置回归得分由引入一个分支得到,直接预测得出.(主要创新点.)
2、提出optimization-based bbox refinement替换传统的regression-based方法,提高了回归部分的可解释性。传统回归直接在proposal上回归, 作者提出了优化方式的回归, 如下图所示,先进行求导, 在原来基础上叠加, 然后不断迭代.使proposal接近最后的结果.
3.提出了Precise ROI Pooling(PrROI Pooling),通过积分方式计算ROI特征使得前向计算的误差进一步降低,
同时反向传播时基于连续输入值计算梯度使得反向传播连续可导,相比之下ROI Pooling和ROI Align由于采用量化或几个点插值方式求ROI特征,不可避免地带来一些噪声,而且在反向求导时只对特定输入回传梯度。
结果表明在ap0.5, 0.6情况下并没有很大的改进, 在0.7以上结果较好.
参考:https://blog.csdn.net/u014380165/article/details/82025507
GIOU
动机:l1,l2 loss和优化目标iou不匹配,
- 预测值和Ground truth没有重叠的话,IoU始终为0且无法优化
- IoU无法辨别不同方式的对齐,比如方向不一致等。
所以提出iou-loss以及GIOU-loss, 直接用GIOU loss取代了l1, l2loss
实验结果也表明GIOU相对IOU只有少量的提升.
参考:https://zhuanlan.zhihu.com/p/57992040
3.上述iou改进想法很好,但是对结果的改进并不是十分明显.针对车牌识别任务, 应该提出适应 iouloss, 以及得分抑制