[目标检测]-NMS系列-cvpr2019-Adaptive NMS 原理详解

最新推荐文章于 2024-07-03 18:58:31 发布

orangezs

最新推荐文章于 2024-07-03 18:58:31 发布

阅读量2.6k

点赞数 2

分类专栏：目标检测计算机视觉图像处理文章标签： python 计算机视觉深度学习算法

本文链接：https://blog.csdn.net/ai_faker/article/details/117419846

版权

目标检测同时被 3 个专栏收录

23 篇文章 6 订阅

订阅专栏

图像处理

16 篇文章 6 订阅

订阅专栏

计算机视觉

11 篇文章 1 订阅

订阅专栏

本文探讨了AdaptiveNMS在密集场景下改进行人检测的方法，通过密度预测模块动态调整NMS阈值，结合Soft-NMS避免过度剔除。关键在于使用IoU计算密度并自适应选择阈值，以提高在复杂遮挡下的检测性能。

摘要由CSDN通过智能技术生成

1.资源

Adaptive NMS: Refining Pedestrian Detection in a Crowd

2.简介

Adaptive NMS的研究者认为这在物体之间有严重遮挡时可能带来不好的结果。
我们期望当物体分布稀疏时，NMS大可选用小阈值以剔除更多冗余框；而在物体分布密集时，NMS选用大阈值，以获得更高的召回。
既然如此，该文提出了密度预测模块，来学习一个框的密度。

就是想要去自适应的调整NMS时的阈值，使得待检测目标不密集时，用较小的NMS阈值杀掉其他的bbox，待检测目标密集呢(出现重叠)，尽可能的保留正确的bbox

3.Adaptive NMS

如何表示密集度呢？

密度定义公式
$d_{i}:=\max _{b_{j} \in \mathcal{G}, i \neq j} \operatorname{iou}\left(b_{i}, b_{j}\right)$

i表示每个生成的候选框bbox，j表示真实标注的框。
即每一个候选框的密度定义为，其与所有真实框的最大iou。以此来表示密度。

于是阈值就被定义为：
$N_{\mathcal{M}}:=\max \left(N_{t}, d_{\mathcal{M}}\right)$
这里的M就表示为，当前集合内，置信度得分最高的候选框bbox。

于是伪代码可以表示如下：

在这里插入图片描述
集合B：就是所有出来的候选框;
集合S：每个候选框的置信度得分;
集合D：每个候选框的密度情况;
Nt：NMS杀框时的阈值;

其中红色框内为原始的NMS流程；绿色框内为Adaptive NMS方法。

4.当Soft-Nms 与 Adaptive NMS结合时

原soft-nms公式：
$s_{i}=\left\{\begin{array}{ll}s_{i}, & \operatorname{iou}\left(\mathcal{M}, b_{i}\right)<N_{t} \\s_{i}\left(1-\operatorname{iou}\left(\mathcal{M}, b_{i}\right)\right), & \operatorname{iou}\left(\mathcal{M}, b_{i}\right) \geq N_{t}\end{array}\right.$

流程图
在这里插入图片描述

可以看到soft-nms是慢慢降低si的得分，即惩罚重叠bbox的得分，而不是简单粗暴的直接删除。相当于慢慢的去筛选重叠部分的bbox。
注意 绿色的部分只替换红色的中间那行，也就是说，绿色的if条件省略掉了，他与红色的相同。

这里将soft-nms 与 adaptive nms结合，可以得到。

密度定义：
$d_{i}:=\max _{b_{j} \in \mathcal{G}, i \neq j} \operatorname{iou}\left(b_{i}, b_{j}\right)$
阈值定义：
$N_{\mathcal{M}}:=\max \left(N_{t}, d_{\mathcal{M}}\right)$
置信度惩罚公式定义：
$s_{i}=\left\{\begin{array}{ll}s_{i}, & \operatorname{iou}\left(\mathcal{M}, b_{i}\right)<N_{\mathcal{M}} \\s_{i} f\left(\operatorname{iou}\left(\mathcal{M}, b_{i}\right)\right), & \operatorname{iou}\left(\mathcal{M}, b_{i}\right) \geq N_{\mathcal{M}}\end{array}\right.$