Non-Maximum Suppression 非极大值抑制
NMS目的:
在检测任务中,一个目标很有可能预测出多个bbox,我们需要剔除不适合的,只留下最好的。这就是NMS的目的。
NMS处理之后
NMS过程:
在目标检测中,很可能需要预测很多类。拿预测人类的特征图来举例,他可能出现很多的bbox,每个bbox网络都会有它是人类框的置信度,我们选出其中置信度最大的一个bbox,然后比较其它的框与它的IoU大小,我们设定一个阈值(threshold),把与最好框的IoU超过阈值的bbox去除。这些超过阈值的bbox与最好的框的重叠程度过大,表明很有可能标定的是同一个物体。
提问:为什么不直接选择最好(置信度最高)的框呢?把其它置信度低的都去掉就好了呀。
因为与最好bbox的IoU低于阈值的框,很可能预测的不是同一个人,不应该去除它。
普通NMS存在的两个问题:
1)图片上存在稀疏不同的两组物体:
例如一张图片,一边有一群人,都站在一起(贴得足够近)&