论文阅读：Adaptive NMS: Refining Pedestrian Detection in a Crowd

最新推荐文章于 2025-03-06 10:50:21 发布

Kivee123

最新推荐文章于 2025-03-06 10:50:21 发布

阅读量6.9k

点赞数 10

本文链接：https://blog.csdn.net/qq_37014750/article/details/89222334

版权

本文探讨了Adaptive-NMS在CVPR 2019上的应用，针对目标检测中NMS的局限性，特别是行人检测在拥挤场景下的问题。普通NMS可能导致过高阈值引发过多误报，而soft-NMS通过减小高IoU检测结果的分数缓解此问题。论文进一步提出了适应人群密度的Adaptive NMS，通过CNN预测密度调整NMS阈值，以优化密集和稀疏场景下的行人检测效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Adaptive-NMS（CVPR 2019）

文章
又是一篇在NMS上面做文章的paper。。读完之后感觉，哇！自己再想的深一点也能想出来呀，可是想出来和做出好效果真是两码事。。尤其是没有人告诉你这个idea的价值只能靠自己判断的时候。扯远了。。。还是说一说这篇文章吧。
NMS是目前基于深度学习的目标检测模型的重要的后处理步骤，针对目标检测来讲，NMS具体操作就是将所有检测结果（设为集合A）中score最大的结果取出来加入到最后的检测结果集合（设为集合B），然后将A中其它检测结果i中与该结果进行比较，如果如该结果的相似度（往往使用IoU）超过一个阈值就将i从A中去掉。重复上述操作，直到A为空空集，伪代码如下（greedy-NMS就是普通的NMS）：

然而普通NMS的问题在于，如果两个ground truth本身就有overlap的话，这个时候就不好办了，如果overlap较小，没有问题，但如果overlap较大呢？比crowd这种场景，这时候要想能检测出两个gt，只能设置较大的阈值来保证较小score的结果不被抑制。可矛盾在于，在crowd这种情况下，人群有时候密集有时候稀疏，高的阈值又会导致对于稀疏