物体检测
在计算机视觉中,有如下四种基本任 务,分别是什么呢?
1. 经典方法:Deformable parts model
提出了一系列非常经典的做法,包括:
a. 如何应用stochastic gradient descent (SGD) 到training里。
b. NMS (non-maximum suppression)对后期testing的处理非常重要。
c. Data mining hard examples这些概念至今仍在使用。
2. 什么是NMS?
一种post-processing 方式。
用在所有检测系统里。
物体检测的指标里,不允许出现多个重复的检测,即使这些结果和真值都比较近。
那么如何删除多余的检测结果呢?
Non-maximum suppression (NMS)
做法:
把所有检测结果按照分值(conf. score)从高到底排序,保留最高分数的 box,那么和它距离上最近的那个box, 就没有必要保留了。
以此类推。
3. 什么是hard mining?
在一个mini-batch 里,能让classifier 混淆的sample (RoIoutputs),标记成hard example, 用到下一轮的训练中。
4. 如果生成目标框呢?
传统方法:selective search
Uijlings et al, “Selective Search for Object Recognition”, IJCV 201330
这是一种自下而上(bottom-up segmentation)的方法:它是基于SLIC算法,先将图像分割成很多小的区域(superpixel), 然后根据小区域之间的相似程度,融合。最后结合各个尺度上的结果,产生很多region proposals.
各种传统生成目标框的方法比较