IoU-uniform R-CNN: Breaking Through the Limitations of RPN 论文笔记

最新推荐文章于 2024-06-25 10:56:25 发布

头柱碳只狼

最新推荐文章于 2024-06-25 10:56:25 发布

阅读量899

点赞数

分类专栏：目标检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30146937/article/details/105786699

版权

本文分析了RPN在目标检测中的局限性，特别是在IoU分布不平衡上的问题。提出IoU均匀R-CNN，通过向每个gt bbox添加可控抖动直接生成正样本，提供均匀IoU分布的训练样本，改善回归和IoU预测分支的性能。此外，通过消除RoI特征偏移进一步提升IoU预测准确性，以优化NMS操作的度量标准。

摘要由CSDN通过智能技术生成

前言

RPN是two-stage目标检测器中的一个核心部分，它用于生成一系列proposal，并且能够过滤大部分负样本，从而避免正负样本间的极端不平衡。不过目前的RPN仍存在一些缺点：

如下图所示，随着IoU的增大，RoI的数量急剧减少，造成IoU分布不平衡，训练样本的分布会偏向较低的IoU；而当IoU较大时，正样本的数量明显不足。这会妨碍检测器的优化，尤其是在IoU较高时。
如下图所示，横坐标是RoI在回归之前与gt的IoU，纵坐标是回归之后的IoU，可以看到，虽然回归之后的定位准确度（output IoU）要高一点，但主要集中在input IoU的low level处，而在input IoU的high level处，定位准确度甚至还有所下降。
如下图所示，IoU较低的RoI占据了大部分的回归损失，并且主导了梯度的计算。

上述问题说明，在较低IoU level上优化的检测器，在其它level上不一定能达到最佳。为解决上述问题，本文向每个gt bbox添加可控制的抖动（jitter）以直接生成正样本，这样可以为回归分支和IoU预测分支提供均匀的IoU分布的样本，从而提升性能。

IoU预测分支可以产生predicted bbox与gt之间的IoU，然后用这个predicted IoU替换分类置信度作为度量来对bbox进行排序，以进行后续NMS操作，从而解决分类置信度与定位精度之间的mis-match问题。但是作者认为在IoU预测分支中，依然存在mis-match问题。 如下图所示，（a）中的红框和黄框都是proposal，绿框是gt，虽然在回归之前，红框的IoU小于黄框，但在（b）中，回归之后的红框明显比黄框更能准确定位目标。但是，由于IoU预测分支的输入依然是回归之前的位置， 因此（b）中红框的IoU依然低于黄框，那么在NMS中更准确的红框可能会被过滤掉。回归前后位置的变换会带来feature offset问题，这个问题主要发生在inference过程中，而正是这个feature offset导致了IoU预测分支中的predicted IoU与定位精度之间的mis-match问题。
在这里插入图片描述
因此本文还通过消除inference时RoI的feature offset，进一步提升IoU预测分支的性能。

方法实现

1. IoU uniform R-CNN

主要思想是直接从每个gt bbox生成训练样本，以训练回归分支和IoU预测分支。首先将IoU划分为

最低0.47元/天解锁文章

头柱碳只狼

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。