提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
NMS、soft NMS、softer NMS与IOU-Guided NMS
一、NMS
非极大值抑制算法(Non-maximum suppression, NMS)的本质是搜索局部极大值,抑制非极大值元素。在计算机视觉技术中主要目的是为了消除多余的框,找到最佳的物体检测的位置,几乎所有的目标检测方法都用到了这种后处理算法。
如上图中,一共有6个识别为人的框,每一个框有一个置信率。 现在需要消除多余的:
· 按置信率排序: 0.95, 0.9, 0.9, 0.8, 0.7, 0.7
· 取最大0.95的框为一个物体框
· 剩余5个框中,去掉与0.95框重叠率IoU大于0.6(可以另行设置),则保留0.9, 0.8, 0.7三个框
· 重复上面的步骤,直到没有框了,0.9为一个框
· 选出来的为: 0.95, 0.9
二、soft NMS
Soft NMS相对于NMS的改进即每次并不是直接排除掉和已选框重叠大于一定阈值的框,而是以一定的策略降低对应框的得分,直到低于某个阈值,从而不至于过多删除拥挤情况下定位正确的框。
下图中,如果直接使用NMS,当设置的阈值比较小的时候,后面置信度为0.8的绿色框就会被直接删掉,从而出现没有检测到后面那匹马的情况,造成了漏检。
根据论文降分的指导原则,一个检测框和高置信度检测框的IOU越大,其置信度的下降幅值应该越大。
M为当前置信度最大的框,bi为候选检测框。
经校验后,在密集检测场景中,NMS会造成漏检,而soft nms可以改善检验效果。若是在非密集检测场景中,NMS的误检问题,并不会被得到改善。
**<hr style=" border:solid; width:100px; height:1px;" color=#000000 size=1">
三、softer NMS**
softer NMS相对于NMS的改进即每次并不是直接以得分最大的框的坐标作为当前选择框的坐标,而是和得分最大的框重叠大于一定阈值的所有框的坐标进行一定策略的加权平均,所得的新的框作为当前选择的得分最大的框的坐标,从而尽可能准确地定位物体。
**<hr style=" border:solid; width:100px; height:1px;" color=#000000 size=1">
四、IOU-Guided NMS**
即以IOU(交并比)得分作为NMS的排序依据,因为IOU得分直接反应了对应框的定位精确程度,优先考虑定位精度较高的框,防止定位精度较低但是其他得分较高的框被误排序到前面。
(1)IOU是对定位准确度的一个天然准则。作者用预测的IOU替换classification confidence作为NMS中的排名关键依据。称为IOU-guided NMS,有助于消除cls conf误导下的错误。
(2)提出了一种与传统的基于回归的方法表现相当的基于优化的bounding box改良流程。使用预测到的IOU优化目标,同时作为定位置信度的可解释性指示量。提出的Precise RoI Pooling layer可以通过梯度上升求解IOU优化。实验表明该方法能与基于CNN的检测器兼容,并且能带来定位准确率的单调上升。