文章地址:
A CONVNET FOR NON-MAXIMUM SUPPRESSION (2016 ICLR Under Review)
##A brief introduction of NMS for object detection
NMS,即Non-maximum suppression,非极大值抑制,在object dection中应用非常广泛,简单地说,他就是对一些region proposals(物体的候选框)进行筛选,得到最佳的物体检测位置。
如上图所示,在做人脸检测时我们可能会得到多个人脸的候选框,但是其实这些框完全可以进行“合并”,得到一个人脸的框框。这个“合并”的策略就是NMS。NMS主要有两个指标来进行合并:
1.score:对于每一个proposal,分类器会给出一个score来表示当前候选框的置信度,尽量保留置信度较高的候选框
2.IoU(Intersection-over Union):重叠面积,位置邻近的候选框重叠面积大于一定阈值的话则进行合并
所以NMS的实现是:
- NMS计算出每一个bounding box的面积,然后根据score进行排序。
- 计算其余bounding box与当前最大score的box的IoU,去除IoU大于设定的阈值的bounding box。
- 重复上面的过程,