selective search 属于传统机器学习方法
在Faster R-CNN中被RPN所取代
在目标检测时,为了定位到目标的具体位置,通常会把图像分成许多子块,然后把子块作为输入,送到目标识别的模型中。分子块的最直接方法叫滑动窗口法。滑动窗口的方法就是按照子块的大小在整幅图像上穷举所有子图像块。这种方法产生的数据量非常大,复杂度太高,产生了很多的冗余候选区域,在现实当中不可行,选择性搜索selective search有效地去除冗余候选区域,使得计算量大大的减小。
我们看上面的一组图片,由于我们事先不知道需要检测哪个类别,因此第一张图中的桌子,瓶子,餐具都是一个个候选目标,而餐具包含在桌子这个目标内,勺子又包含在碗内。这张图展示了目标检测的层级关系以及尺度关系,那我们如何去获得这些可能目标的位置呢?能否通过视觉特征去减少候选框的数量并提高精度呢?
图像可用的特征很多,到底什么特征是有用的呢?
(1) 看第二幅图片中的两只猫咪,他们的纹理是一样的,所以通过纹理特征区分猫是不可行的,但两只猫颜色不一样,因此通过颜色特征比较有用。
(2) 看第三幅图片,变色龙,会发现颜色特征在这里不好用,但会发现若用边缘特征,纹理特征就会较好用。
(3) d图中,我们很容易把车和轮胎看作是一个整体ÿ