在faster rcnn中使用soft nms，faster rcnn的改进（一）

最新推荐文章于 2025-09-15 02:11:55 发布

原创

最新推荐文章于 2025-09-15 02:11:55 发布 · 9.9k 阅读

69 ·

CC 4.0 BY-SA版权

文章标签：

#faster rcnn改进 #soft nms #kitti检测 #map提升 #faster rcnn

通过在Faster R-CNN中应用Soft NMS代替原始NMS，作者在Kitti数据集上的mAP从0.586提升到0.622。本文档详细介绍了如何在TensorFlow版本的Faster R-CNN中实施这一改进，涉及修改`cpu_nms.pyx`、`nms_wrapper.py`、`config.py`和`test.py`，以及重新编译程序的步骤。

1. 背景介绍

我的项目是利用faster rcnn检测kiiti数据集，用原始nms，iters = 10000的情况下，得到的mAP = 0.586, 在改用soft nms后，其他参数均不变的情况下，得到的mAP = 0.622。算是挺大的改进了，所以分享一下具体实现。
我用的Faster-RCNN是tensorflow版本，github地址：Faster-RCNN_TF

2. soft-NMS

Soft-NMS （Improving Object Detection With One Line of Code）

Paper：https://arxiv.org/pdf/1704.04503.pdf
code：https://github.com/bharatsingh430/soft-nms
论文解读可以参考：https://blog.csdn.net/lanyuxuan100/article/details/78767818

该篇论文主要focus在后处理NMS上，不得不承认，对于很多问题，后处理的方法会对结果产生几个点的影响。况且尝试起来非常容易，代价也很小，只需要替换一个函数就可以，所以大家不妨可以试验一下。

3. 具体步骤

3.1. 修改/lib/nms/cpu_nms.pyx

在文件里添加 cpu_soft_nms函数：

def cpu_soft_nms(np.ndarray[float, ndim=2] boxes, float sigma=0.5, float Nt=0.3, float threshold=0.001, unsigned int method=0):
    cdef unsigned int N = boxes.shape[0]
    cdef float iw, ih, box_area
    cdef float ua
    cdef int pos = 0
    cdef float maxscore = 0
    cdef int maxpos = 0
    cdef float x1,x2,y1,y2,tx1,tx2,ty1,ty2,ts,area,weight,ov

    for i in range(N):
        maxscore = boxes[i, 4]
        maxpos = i

        tx1 = boxes[i,0]
        ty1 = boxes[i,1]
        tx2 = boxes[i,2]
        ty2 = boxes[i,3]
        ts = boxes[i,4]

        pos = i + 1
    # get max box
        while pos < N:
            if maxscore < boxes[pos, 4]:
                maxscore = boxes[pos, 4]
                maxpos = pos
            pos = pos + 1

    # add max box as a detection 
        boxes[i,0] = boxes[maxpos,0]
        boxes[i,1] = boxes[maxpos,1]
        boxes[i,2] = boxes[maxpos,2]
        boxes[i,3] = boxes[maxpos,3]
        boxes[i,4] = boxes[maxpos,4]

    # swap ith box with position of max box
        boxes[maxpos,0] = tx1
        boxes[maxpos,1] = ty1
        boxes[maxpos,2] = tx2
        boxes[maxpos,3] = ty2
        boxes[maxpos,4] = ts

        tx1 = boxes[i,0]
        ty1 = boxes[i,1]
        tx2 = boxes[i,2]
        ty2 = boxes[i,3]
        ts = boxes[i,4]

        pos = i + 1
    # NMS iterations, note that N changes if detection boxes fall below threshold
        while pos < N:
            x1 = boxes[pos, 0]
            y1 = boxes[pos, 1]
            x2 = boxes[pos, 2]
            y2 = boxes[pos, 3]
            s = boxes[pos, 4]

            area = (x2 - x1 + 1) * (y2 - y1 + 1)
            iw = (min(tx2, x2) - max(tx1, x1) + 1)
            if iw > 0:
                ih = (min(ty2, y2) - max(ty1, y1) + 1)
                if ih > 0:
                    ua = float((tx2 - tx1 + 1) * (ty2 - ty1 + 1) + area - iw * ih)
                    ov = iw * ih / ua #iou between max box and detection box

                    if method == 1: # linear
                        if ov > Nt: 
                            weight = 1 - ov
                        else:
                            weight = 1
                    elif method == 2: # gaussian
                        weight = np.exp(-(ov * ov)/sigma)
                    else: # original NMS
                        if ov > Nt: 
                            weight = 0
                        else:
                            weight = 1

                    boxes[pos, 4] = weight*boxes[pos, 4]

            # if box score falls below threshold, discard the box by swapping with last box
            # update N
                    if boxes[pos,

最低0.47元/天解锁文章

20 条评论

weixin_47755558 2021.01.11
请问ts是指的什么

weixin_45439622 2020.09.17
博主您好，按您的修改以后，运行test.py后，一直陷入死循环，一直再重复运行代码是啥原因？

qq_45261807 2020.07.10
请问出现import error:no model named 'cpu_soft_nms'怎么解决呀

qq_37578719 2020.01.17
博主您好，请问按着您的步骤完成替换之后并训练之后，测试demo的时候提示AttributeError: 'EasyDict' object has no attribute 'DEDUP_BOXES'该怎么解决呢？希望得到博主的答复
- m0_47058313回复weixin_44933966 2020.07.12
  [reply]weixin_44933966[/reply]要在configuration中添加__C.DEDUP_BOXES = 1./16.，不过后面还有其他错误
- qq_45261807回复qq_37578719 2020.07.12
  [reply]qq_37578719[/reply]请问您的问题解决了吗，我在测试的时候也遇到了同样的问题，谢谢分享
- weixin_44933966回复qq_37578719 2020.07.09
  [reply]qq_37578719[/reply]你好，请问你知道是什么原因了吗

秋名山翻车的 2019.08.17
博主你好，请问修改完了之后，是需要重新训练，还是只需要测试就行了？
- 闻溪1900回复WangWang3219 2019.10.16
  [reply]WangWang3219[/reply] soft-nms参与了对RPN的训练
- WangWang3219回复风轻扬逍遥子 2019.09.19
  [reply]u014256231[/reply] 您好，请问为什么需要重新训练呢？我感觉直接测试就可以了呀。
- 秋名山翻车的回复风轻扬逍遥子 2019.08.19
  [reply]u014256231[/reply] 好的，谢谢博主!
- 风轻扬逍遥子回复秋名山翻车的 2019.08.19
  [reply]foolishpeng[/reply] 需要重新训练的

qq_38327318 2019.05.16
楼主你好，关于test.py中修改的地方在哪，我找不到。。能提示一下吗

梨落琴川 2019.01.14
楼主你好。在该博客中，3.4，test.py，第178行，得到的 rois 和bbox_pred，应该是在resize后600*800的图像上的（例如原图750*1000）；第185行，rois 缩放回到原图（750*1000）上得到boxes；第199行，将原图上的boxes 和resize后的图像上的bbox_pred相加，这是为什么呀？
- qq_37996968回复梨落琴川 2019.04.26
  [reply]susansmile1014[/reply] 你好，我对于你提出的这个问题有一些自己的看法，你看看我说的对不对。我们都知道Faster RCNN中有两个地方使用了bbox_regression，而bbox_regression的目的就是让预测得到的边界框更加的准确，更加接近真实的边界框。也就是说，Faster RCNN中对bbox进行了两次边框回归，通过两次边框回归，最终得到了一个bbox，这个bbox更加的接近真实的gt_box。而第一次bbox regression是在RPN网络中，是让得到的anchor更接近真实的gt，得到了rois，也就是你所说的test.py里第178行的rois。第二次bbox regression是在Fast rcnn网络中，是对网络上一步得到的rois再次进行边框回归，使得rois的坐标再一次更加的接近gt_box。也就是你所说的第199行，边框回归的过程。而在这两次边框回归的过程中，网络输入的是经过resize以后的图片，假设你说的600*800的图片，所以第一步得到的rois也是相对于600*800的，但是gt是相对于原图的，所以我们要将检测框rois映射回原图中，得到最终在原图上的四个边框坐标，再进行第二步的bbox regression。得到最终相对于原图的boxes的坐标。至于你说的，为什么第二步回归的时候，要用原图上的box与resize上的坐标偏移值bbox_pred进行回归，我的理解是，bbox_pred就是从resize后的图片上得到的，而且一般来说，resize进行的是放大图片的操作（目的是检测叫小尺度的物体），这样得到的bbox_pred会更加的准确。以上。

weixin_39410100 2018.06.12
@博主你好，那个GPU版本的softnms你实现了吗，因为考虑用CPU速度较慢，所以感觉修改成gpu版本的速度要快些吧
- 面对疾风吧~回复渡伴 2020.08.12
  [reply]weixin_43868576[/reply]没有
- 渡伴回复面对疾风吧~ 2020.07.16
  [reply]qq_43229471[/reply]请问您的gpu版本实现了嘛
- 面对疾风吧~回复weixin_39410100 2019.05.23
  [reply]weixin_39410100[/reply] 您好，请问您gpu版本的softnms实现了么

Pre_Con 2018.05.29
大佬，matlab版的faster rcnn怎么实现啊

傲娇的程序猿 2018.05.19
如果用gpu训练那就应该改gpu_nms.pyx这个代码是吧？
- 面对疾风吧~回复傲娇的程序猿 2019.05.23
  [reply]qq_23126625[/reply] 您好，请问你修改的gpu版本的nms实现了吗？
- soft76ers回复傲娇的程序猿 2019.05.12
  [reply]qq_23126625[/reply] 你好，请问你的修改Gpu版本的nms实现了吗