对于目标检测往往第一步就是生成可能的region proposal,但是region proposal是如何获取的?
下面介绍一下最常见的方法Selective Search方法。
首先通过简单的区域划分算法,将图片划分成很多小区域,再通过相似度和区域大小(小的区域先聚合,这样是防止大的区域不断的聚合小区域,导致层次关系不完全)不断的聚合相邻小区域。
那么如何进行合并聚合呢?
即是:
step0:生成区域集R。
step1:计算区域集R里每个相邻区域的相似度S={s1,s2,…}。
step2:找出相似度最高的两个区域,将其合并为新集,添加进R。
step3:从S中移除所有与step2中有关的子集。
step4:计算新集与所有子集的相似度。
step5:跳至step2,直至S为空。
其中每次产生的图像块包括合并的图像块我们都保存下来。
如何计算相似性呢?
为了保持合并多样性策略,可以采用多种方法来保证候选区域的多样性:
- 多种颜色空间,考虑RGB、灰度、HSV及其变种等
- 多种相似度度量标准,既考虑颜色相似度,又考虑纹理、大小、重叠情况等。
- 通过改变阈值初始化原始区域,阈值越大,分割的区域越少。
当然,生成了候选区域之后,还可以进一步优化,减少候选区域,具体方法这里就不一一介绍了。