selective search算法

最新推荐文章于 2024-08-20 19:55:37 发布

lianhuijuan

最新推荐文章于 2024-08-20 19:55:37 发布

阅读量3.7k

点赞数 1

分类专栏： python 文章标签： python 合并 SS算法

本文链接：https://blog.csdn.net/lianhuijuan/article/details/64443008

版权

python 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

在介绍Selective Search之前，先说说其需要考虑的几个问题：

1. 适应不同尺度：穷举搜索（Exhaustive Selective）通过改变窗口大小来适应物体的不同尺度，选择搜索（Selective Search）同样无法避免这个问题。算法采用了图像分割（Image Segmentation）以及使用一种层次算法（Hierarchical Algorithm）有效地解决了这个问题。

2. 多样化：单一的策略无法应对多种类别的图像。使用颜色（color）、纹理（texture）、大小（size）等多种策略对分割好的区域（region）进行合并。

3. 速度快（Fast to Compute）：算法，唯快不破！

一：区域合并算法

输入：彩色图片（三通道）

输出：物体位置的可能结果L

主要思想是：

1. 使用 Efficient Graph-Based Image Segmentation的方法获取原始分割区域R={r1,r2,…,rn}

2. 初始化相似度集合S=∅

3. 计算两两 相邻区域之间的相似度（见第三部分），将其添加到相似度集合S中

4. 从相似度集合S中找出， 相似度最大的两个区域 ri 和rj，将其合并成为一个区域 rt，从相似度集合中除去原先与ri和rj相邻区域之间计算的相似度，计算rt与其相邻区域（原先与ri或rj相邻的区域）的相似度，将其结果添加的到相似度集合S中。同时将新区域 rt 添加到区域集合R中。

5. 获取每个区域的Bounding Boxes，这个结果就是物体位置的可能结果L。

二相似度计算

在区域合并的时候有说道计算区域之间的相似度，论文章介绍了四种相似度的计算方法。

1. 颜色（color）相似度

使用L1-norm归一化获取图像每个颜色通道的25 bins的直方图，这样每个区域都可以得到一个75维的向量

，区域之间颜色相似度通过下面的公式计算：

在区域合并过程中使用需要对新的区域进行计算其直方图，计算方法：

2. 纹理（texture）相似度

这里的纹理采用SIFT-Like特征。具体做法是对每个颜色通道的8个不同方向计算方差σ=1的高斯微分（Gaussian Derivative），每个通道每个颜色获取10 bins的直方图（L1-norm归一化），这样就可以获取到一个240维的向量

，区域之间纹理相似度计算方式和颜色相似度计算方式类似，合并之后新区域的纹理特征计算方式和颜色特征计算相同：

3. 大小（size）相似度

这里的大小是指区域中包含像素点的个数。使用大小的相似度计算，主要是为了尽量让小的区域先合并：

4. 吻合（fit）相似度

这里主要是为了衡量两个区域是否更加“吻合”，其指标是合并后的区域的Bounding Box（能够框住区域的最小矩形（没有旋转））越小，其吻合度越高。其计算方式：

最后将上述相似度计算方式组合到一起，可以写成如下，其中

：

三选择搜索（Selective Search）进行物体识别

通过前面的区域合并，可以得到一些列物体的位置假设L。接下来的任务就是如何从中找出物体的真正位置并确定物体的类别。

（1）特征生成

系统在实现过程中，使用spatial pyramid divsion提取特征，详见我的博客。

（2）迭代训练

首先选择包含真实结果（ground truth）的物体窗口作为正样本（positive examples），选择与正样本窗口重叠20%~50%的窗口作为负样本（negative examples）。在选择样本的过程中剔除彼此重叠70%的负样本，这样可以提供一个较好的初始化结果。在重复迭代过程中加入得分很高的负样本，这样是为了增加困难样本数。使用其进行模型训练，直到收敛（精度不在产生变化）。