玩转NMS

最新推荐文章于 2024-01-17 13:24:13 发布

有点方

最新推荐文章于 2024-01-17 13:24:13 发布

阅读量544

点赞数

分类专栏：计算机视觉图像处理 NMS 文章标签：机器学习深度学习神经网络

本文链接：https://blog.csdn.net/qq_35447659/article/details/107410527

版权

计算机视觉同时被 3 个专栏收录

18 篇文章 1 订阅

订阅专栏

图像处理

4 篇文章 0 订阅

订阅专栏

NMS

1 篇文章 0 订阅

订阅专栏

NMS的改进

非极大值抑制NMS是目标检测常用的后处理算法，用于剔除冗余检测框，本文将对可以提升精度的各种NMS方法及其变体进行阶段性总结。

对NMS进行分类，大致可分为以下六种，这里是依据它们在各自论文中的核心论点进行分类，这些算法可以同时属于多种类别。

分类：NMS，Soft-NMS (ICCV 2017)
定位：IoU-Guided NMS (ECCV 2018)
加权平均：Weighted NMS (ICME Workshop 2017) Softer-NMS (CVPR 2019)
自适应阈值：Adaptive NMS (CVPR 2019)
+中心点距离：DIoU-NMS (AAAI 2020)

分类优先

Traditional NMS算法是最为经典的版本，伪代码如下：

缺点：

顺序处理的模式，计算IoU拖累了运算效率。
剔除机制太严格，依据NMS阈值暴力剔除。
阈值是经验选取的。
评判标准是IoU，即只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面。

Soft-NMS是Traditional NMS的推广，主要旨在缓解Traditional NMS的第二条缺点。

显然，对于IoU≥NMS阈值的相邻框，Traditional NMS的做法是将其得分暴力置0。这对于有遮挡的案例较不友好。因此Soft-NMS的做法是采取得分惩罚机制，使用一个与IoU正相关的惩罚函数对得分进行惩罚。

线性惩罚：

其中M代表当前的最大得分框。

线性惩罚有不光滑的地方，因而还有一种高斯惩罚：

在迭代终止之后，Soft-NMS依据预先设定的得分阈值来保留幸存的检测框，通常设为0.0001

该文对两种惩罚方法的超参数也进行了实验，结果验证了超参数的不敏感性。经本人实测，Soft-NMS在Faster R-CNN中的提升约有0.5-0.8个点的AP提升。

缺点：

仍然是顺序处理的模式，运算效率比Traditional NMS更低。
对双阶段算法友好，而在一些单阶段算法上可能失效。
如果存在定位与得分不一致的情况，则可能导致定位好而得分低的框比定位差得分高的框惩罚更多(遮挡情况下)。
评判标准是IoU，即只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面。

定位

IoU-Guided NMS出现于IoU-Net一文中，研究者认为框的定位与分类得分可能出现不一致的情况，特别是框的边界有模棱两可的情形时。因而该文提出了IoU预测分支，来学习定位置信度，进而使用定位置信度来引导NMS。

具体来说，就是使用定位置信度作为NMS的筛选依据，每次迭代挑选出最大定位置信度的框M，然后将IoU≥NMS阈值的相邻框剔除，但把冗余框及其自身的最大分类得分直接赋予M，这样一来，最终输出的框必定是同时具有最大分类得分与最大定位置信度的框。

优点：

IoU-Guided NMS有助于提高严格指标下的精度，如AP75, AP90。

缺点：

顺序处理的模式，运算效率与Traditional NMS相同。
需要额外添加IoU预测分支，造成计算开销。
评判标准是IoU，即只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面。

加权平均

Weighted NMS出现于ICME Workshop 2017《Inception Single Shot MultiBox Detector for object detection》一文中。论文认为Traditional NMS每次迭代所选出的最大得分框未必是精确定位的，冗余框也有可能是定位良好的。那么与直接剔除机制不同，Weighted NMS顾名思义是对坐标加权平均，加权平均的对象包括 M自身以及IoU≥NMS阈值的相邻框。

加权的权重为，表示得分与IoU的乘积。

代码：

import numpy as np


def weighted_nms_dict(input_dict, thresh=0.5):
    """
    Takes a Tensorflow Object Detection API style predition dict
    and outputs dict with weighted NMS-ed bounding boxes
    """
    dets = np.hstack((input_dict['detection_boxes'],
                      np.expand_dims(input_dict['detection_scores'], 1)))
    dets = dets[:input_dict['num_detections'], :]

    max_ids, weighted_boxes = weighted_nms(dets, thresh)

    output_dict = {
                   'num_detections': len(max_ids),
                   'detection_boxes': weighted_boxes,
                   'detection_scores': input_dict['detection_scores'][max_ids],
                   'detection_classes': input_dict['detection_classes'][max_ids]
                   }
    return output_dict


def weighted_nms(dets, thresh=0.5):
    """
    Takes bounding boxes and scores and a threshold and applies 
    weighted non-maximal suppression.
    """
    scores = dets[:, 4]
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]

    areas = (x2 - x1) * (y2 - y1)
    order = scores.argsort()[::-1]

    max_ids = []
    weighted_boxes = []
    while order.size > 0:
        i = order[0]
        max_ids.append(i)
        xx1 = np.maximum(x1[i], x1[order[:]])
        yy1 = np.maximum(y1[i], y1[order[:]])
        xx2 = np.minimum(x2[i], x2[order[:]])
        yy2 = np.minimum(y2[i], y2[order[:]])

        w = np.maximum(0.0, xx2 - xx1)
        h = np.maximum(0.0, yy2 - yy1)
        inter = w * h
        iou = inter / (areas[i] + areas[order[:]] - inter)

        in_inds = np.where(iou >= thresh)[0]
        in_dets = dets[in_inds, :]

        weights = in_dets[:, 4] * iou[in_inds]
        wbox = np.sum((in_dets[:, :4] * weights[..., np.newaxis]), axis=0) \
            / np.sum(weights)
        weighted_boxes.append(wbox)

        out_inds = np.where(iou < thresh)[0]
        order = order[out_inds]
        dets = dets[out_inds]

    return max_ids, np.array(weighted_boxes)

优点：

Weighted NMS通常能够获得更高的Precision和Recall，以本人的使用情况来看，只要NMS阈值选取得当，Weighted NMS均能稳定提高AP与AR，无论是AP50还是AP75，也不论所使用的检测模型是什么。

缺点：

顺序处理模式，且运算效率比Traditional NMS更低。
加权因子是IoU与得分，前者只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面；而后者受到定位与得分不一致问题的限制。

Softer-NMS同样是坐标加权平均的思想，不同在于权重发生变化，以及引入了box边界的不确定度。

加权公式如下：

其中权重抛弃了得分，而只与IoU有关。

在加权平均的过程中，权重越大有两种情形：1. 与M的IoU越大；2.方差越小，代表定位不确定度越低。

伪代码：

优点：

可以与Traditional NMS或Soft-NMS结合使用。
通常可以稳定提升AP与AR。

缺点：

顺序处理模式，且运算效率比Traditional NMS更低。
需要修改模型来预测方差。
加权因子是IoU与方差，前者依然只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面。

自适应阈值

以上这些NMS都基于这样的假设：与当前最高得分框重叠越大，越有可能是冗余框。

Adaptive NMS的研究者认为这在物体之间有严重遮挡时可能带来不好的结果。我们期望当物体分布稀疏时，NMS大可选用小阈值以剔除更多冗余框；而在物体分布密集时，NMS选用大阈值，以获得更高的召回。既然如此，该文提出了密度预测模块，来学习一个框的密度。

一个GT框的密度标签定义如下，

模型的输出将变为，分别代表box坐标，宽高，分类得分，密度，其中密度越大，代表该框所处的位置的物体分布越密集，越有可能是遮挡严重的地方；反之密度d越小，代表该框所处的位置的物体分布越稀疏，不太可能有遮挡。

论文以Traditionnal NMS和Soft-NMS的线性惩罚为基础，将每次迭代的NMS阈值更改如下：

其中thresh代表最小的NMS阈值。

伪代码：

优点：

可以与前面所述的各种NMS结合使用。
对遮挡案例更加友好。

缺点：

与Soft-NMS结合使用，效果可能倒退 (受低分检测框的影响)。
顺序处理模式，运算效率低。
需要额外添加密度预测模块，造成计算开销。
评判标准是IoU，即只考虑两个框的重叠面积，这对描述box重叠关系或许不够全面。

+中心点距离

DIoU-NMS出现于Distance-IoU一文，研究者认为若相邻框的中心点越靠近当前最大得分框的中心点，则其更有可能是冗余框。也就是说，考虑IoU相同的情况，如下所示

第一种相比于第三种越不太可能是冗余框。基于该观点，研究者使用所提出的DIoU替代IoU作为NMS的评判准则，公式如下：

DIoU的定义为:

而在实际操作中，研究者还引入了参数，用于控制的惩罚幅度。即

由公式可以看出，

当时，DIoU退化为IoU，此时的DIoU-NMS与Traditional NMS效果相当。
当时，此时几乎所有中心点不与M重合的框都被保留了。

研究者进一步比较了Traditional NMS和DIoU-NMS的性能，在YOLOv3和SSD上，选取NMS阈值为[0.43,0.48]。可以看到DIoU-NMS在每个阈值上都优于Traditional NMS，此外还值得一提的是，即便是性能最差的DIoU-NMS也比性能最好的Traditional NMS相当或更优，说明即便不仔细调整NMS阈值，DIoU-NMS也通常能够表现更好。

这里顺便一提，既然都比了[0.43, 0.48]的阈值，就让人比较好奇更宽的阈值范围会怎样？Traditional NMS会不会有反超DIoU-NMS的情况？当然我个人比较认同DIoU-NMS更优的范围会大一些，也就是NMS阈值不必精调也可放心使用DIoU-NMS。

优点：

从几何直观的角度，将中心点考虑进来有助于缓解遮挡案例。
可以与前述NMS变体结合使用。
保持NMS阈值不变的情况下，必然能够获得更高recall (因为保留的框增多了)，至于precision就需要调来平衡了。
个人认为+中心点距离的后处理可以与DIoU/CIoU损失结合使用，这两个损失一方面优化IoU，一方面指引中心点的学习，而中心点距离学得越好，应该对这种后处理思想的执行越有利。

缺点：

依然是顺序处理模式，运算效率低。
DIoU的计算比IoU更复杂一些，这会降低运算效率。
在保持NMS阈值不变的情况下，使用DIoU-NMS会导致每次迭代剩余更多的框，这会增加迭代轮数，进一步降低运算效率。(经本人实测，DIoU-NMS是Traditional NMS 起码1.5倍耗时)

总结：

加权平均法通常能够稳定获得精度与召回的提升。
定位优先法，方差加权平均法与自适应阈值法需要修改模型，不够灵活。
中心点距离法可作为额外惩罚因子与其他NMS变体结合。
得分惩罚法会改变box的得分，打破了模型校准机制。
运算效率的低下可能会限制它们的实时应用性。

文章参考：https://blog.csdn.net/weixin_43900320/article/details/107048094

有点方

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
玩转NMS

NMS的改进非极大值抑制NMS是目标检测常用的后处理算法，用于剔除冗余检测框，本文将对可以提升精度的各种NMS方法及其变体进行阶段性总结。对NMS进行分类，大致可分为以下六种，这里是依据它们在各自论文中的核心论点进行分类，这些算法可以同时属于多种类别。分类：NMS，Soft-NMS (ICCV 2017) 定位：IoU-Guided NMS (ECCV 2018) 加权平均：Weighted NMS (ICME Workshop 2017) Softer-NMS (CVPR 2019) 自
复制链接

扫一扫