以模型预测阶段为例,一张图片上的一个目标可能包括多个预测边界框,为了使结果更加简洁,我们可以移除相似的预测边界框。常用的方法叫作非极大值抑制(non-maximum suppression,NMS)。
原理:
- 对于一个预测边界框B,模型会计算各个类别的预测概率。设其中最大的预测概率为p,该概率所对应的类别即B的预测类别。我们也将p称为预测边界框BB的置信度。
- 在同一图像上,我们将预测类别非背景的预测边界框按置信度从高到低排序,得到列表L。
- 从L中选取置信度最高的预测边界框B1作为基准,将所有与B1的交并比大于某阈值的非基准预测边界框从LL中移除。这里的阈值是预先设定的超参数。此时,LL保留了置信度最高的预测边界框并移除了与其相似的其他预测边界框。
- 接下来,从LL中选取置信度第二高的预测边界框B2 作为基准,将所有与B2 的交并比大于某阈值的非基准预测边界框从L中移除。
- 重复这一过程,L中任意一对预测边界框的交并比都小于阈值.最终,输出列表L中的所有预测边界框。
分析
从原理可以看出,nms处理时,当2个预测目标靠的很近时,置信度低的会被删除掉,从而2个靠的很近的目标会被识别成1个。