目标检测中的非极大值抑制（NMS）

最新推荐文章于 2024-07-23 19:19:39 发布

Jackie_Wang11

最新推荐文章于 2024-07-23 19:19:39 发布

阅读量1.6k

点赞数

分类专栏：目标检测 CV 深度学习与机器学习文章标签：目标检测深度学习人工智能

本文链接：https://blog.csdn.net/jq_98/article/details/122837164

版权

深度学习与机器学习同时被 3 个专栏收录

27 篇文章 1 订阅

订阅专栏

20 篇文章 0 订阅

订阅专栏

目标检测

9 篇文章 1 订阅

订阅专栏

目标检测中的非极大值抑制（NMS）

非极大值抑制（Non-Maximum Suppersion, NMS）
IOU(交并比)
非极大值抑制NMS算法流程
代码示例

非极大值抑制（Non-Maximum Suppersion, NMS）

在目标检测过程中，在同一目标位置上回产生大量的候选框（proposal），这些候选框相互之间会存在重叠现象，此时我们需要利用非极大值抑制来找到最佳的目标边界框，并且消除冗余的边界框。

IOU(交并比)

IOU(Intersection-Over-Union): 两个边界框的交集部分除以它们的并集部分，数值越大代表两个边界框的重合部分越多
在这里插入图片描述

非极大值抑制NMS算法流程

前提：目标边界框列表及其对应的置信度得分列表，设定IOU阈值，此阈值用于删除重叠较大的边界框。

NMS算法流程：

根据置信度得分进行排序
计算置信度最高的边界框添加得到最终输出列表中，将其从边界框列表中删除
计算所有边界框的面积
计算置信度最高的边界框与其他候选框的IOU值
删除IOU值大于阈值的边界框；
如果还剩余的边界框，则重复上诉步骤3，直至边界框列表为空

产生proposal后使用分类网络给出每个框的每类置信度,使用回归网络修正位置,最终应用NMS.
Faster R-CNN中设置的IOU阈值是0.7

到这里如果还没有理解NMS算法是怎么个工作流程的话，我们不妨举一个例子：

就像上面的图片一样，定位一个车辆，最后算法就找出了一堆的方框，我们需要判别哪些矩形框是没用的。非极大值抑制的方法是：先假设有6个矩形框，根据分类器的类别分类概率做排序，假设从小到大属于车辆的概率分别为A、B、C、D、E、F。

(1)从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;

(2)假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我们保留下来的。

(3)从剩下的矩形框A、C、E中，选择概率最大的E，然后判断E与A、C的重叠度，重叠度大于一定的阈值，那么就扔掉；并标记E是我们保留下来的第二个矩形框。

就这样一直重复，找到所有被保留下来的矩形框。

代码示例

在R-CNN中使用了NMS来确定最终的bbox,其对每个候选框送入分类器,根据分类器的类别分类概率做排序(论文中称为greedy-NMS).但其实也可以在分类之前运用简单版本的NMS来去除一些框.
在这里插入图片描述

def py_cpu_nms(dets, thresh):
    """Pure Python NMS baseline."""
    #x1、y1、x2、y2、以及score赋值
    x1 = dets[:, 0]
    y1 = dets[:, 1]
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    scores = dets[:, 4]

    #每一个检测框的面积
    areas = (x2 - x1 + 1) * (y2 - y1 + 1)
    #按照score置信度降序排序
    order = scores.argsort()[::-1]

    keep = [] #保留的结果框集合
    while order.size > 0:
        i = order[0]
        keep.append(i) #保留该类剩余box中得分最高的一个
        #得到相交区域,左上及右下
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        #计算相交的面积,不重叠时面积为0
        w = np.maximum(0.0, xx2 - xx1 + 1)
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        #计算IoU：重叠面积 /（面积1+面积2-重叠面积）
        ovr = inter / (areas[i] + areas[order[1:]] - inter)
        #保留IoU小于阈值的box
        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1] #因为ovr数组的长度比order数组少一个,所以这里要将所有下标后移一位
       
    return keep