非极大值抑制non-maximum suppression的理解与实现

当我们在阅读目标检测相关论文时一定会遇到NMS即非最大值抑制算法。
那它到底是什么呢?
非极大值抑制,简称为NMS算法,英文为Non-Maximum Suppression。其思想是搜素局部最大值,抑制极大值。

为什么我们在目标检测(DPM,YOLO,SSD,Faster R-CNN)等论文中会用到它?
目标检测中,我们会对原图像即输入搜索出很多个region proposal(2000个在R-CNN中),那么在一个类别的检测中就会不可避免的产生很多冗余的候选框,这些候选框相互之间可能会有重叠,此时我们需要利用非极大值抑制找到最佳的目标边界框,消除冗余的边界框。在这里插入图片描述
过程:

去除冗余的重叠 Boxes,对全部的 Boxes 进行迭代-遍历-消除.

1.将所有框的得分排序,选中最高分及其对应的框;

2.遍历其余的框,如果和当前最高分框的重叠面积(IOU)大于一定阈值,则将框删除;

3.从未处理的框中继续选一个得分最高的,重复上述过程.

pthon实现过程如下:

# --------------------------------------------------------
# Fast R-CNN
# Copyright (c) 2015 Microsoft
# Licensed under The MIT License [see LICENSE for details]
# Written by Ross Girshick
# --------------------------------------------------------

import numpy as np

# dets: 检测的 boxes 及对应的 scores;
# thresh: 设定的阈值


def nms(dets, thresh):
    # boxes 位置
    x1 = dets[:, 0]  
    y1 = dets[:, 1] 
    x2 = dets[:, 2]
    y2 = dets[:, 3]
    # boxes scores
    scores = dets[:, 4]

    areas = (x2 - x1 + 1) * (y2 - y1 + 1) # 各 box 的面积
    order = scores.argsort()[::-1] # boxes 的按照 score 排序

    keep = [] # 记录保留下的 boxes
    while order.size > 0:
        i = order[0] # score 最大的 box 对应的 index
        keep.append(i) # 将本轮 score 最大的 box 的 index 保留

        # 计算剩余 boxes 与当前 box 的重叠程度 IoU
        xx1 = np.maximum(x1[i], x1[order[1:]])
        yy1 = np.maximum(y1[i], y1[order[1:]])
        xx2 = np.minimum(x2[i], x2[order[1:]])
        yy2 = np.minimum(y2[i], y2[order[1:]])

        w = np.maximum(0.0, xx2 - xx1 + 1) # IoU
        h = np.maximum(0.0, yy2 - yy1 + 1)
        inter = w * h
        ovr = inter / (areas[i] + areas[order[1:]] - inter)

        # 保留 IoU 小于设定阈值的 boxes
        inds = np.where(ovr <= thresh)[0]
        order = order[inds + 1]

    return keep


参考资料
https://www.jianshu.com/p/d452b5615850

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值