关于two stage目标检测算法中的SSD在目标选取阶段的使用的ss算法的一些学习资料
简介
一张图像中包含的信息非常丰富,图像中的物体有不同的形状、尺寸、颜色、纹理,而且物体间还有层次(hierarchical)关系
要将候选框合适的框取到我们想要的目标是很困难的,传统的不同尺度的候选框进行滑动图像的策略计算量太大,而改进的selective search的策略是,
选择性搜索是区域提议算法,其基于颜色,纹理,大小和形状等图像特征量,同时兼容计算相似区域的分层分组
Selective Search算法主要包含两个主要部分:Hierarchical Grouping Algorithm(层次聚类算法) & Diversification Strategies(多元化策略)
层次聚类算法
通俗理解一下算法原理
首先通过Felzenszwalb and Huttenlocher方法的图像分割方法初始化原始区域
而后使用贪心算法吉林相关迭代分组
- 每次计算每两个相邻的区域的相似度,然后每次合并最相似的两块,继续迭代,直到最终只剩下一块完整的图片
然后这其中每次产生的图像块包括合并的图像块我们都保存下来,这样就得到图像的分层表示
下面是算法的具体描述;
输入:图片(三通道)
输出:物体位置的可能结果L
获得初始分割区域R={r1,r2,…,rn},使用Felzenszwalb and Huttenlocher提出的方法
初始化相似度集合S=∅;
foreach计算两两相邻区域之间的相似度,将其添加到相似度集合S中;
迭代从集合S中找出,相似度最大的两个区域 ri 和rj
将其合并成为一个区域 rt
从集合中删去原先与ri和rj相邻区域之间计算的相似度
计算rt与其相邻区域(与ri或rj相邻的区域)的相似度
将其结果加入到相似度集合S中
同时将新区域 rt 添加到区域集合R中;
最后获取每个区域的Bounding Boxes L,输出物体位置的可能结果L.
Diversification Strategies
为了尽最大可能去分割所有情景的图片,我们需要保持特征的多样性.这便需要用到Diversification Strategies
主要通过两种方式保持特征多样性
- 通过色彩空间变换,将原始色彩空间转换到多达八中的色彩空间
- 通过多样性的距离计算方式,综合颜色、纹理等所有的特征
参考:
Felzenszwalb P F, Huttenlocher D P. Efficient Graph-Based Image Segmentation[J]. International Journal of Computer Vision, 2004, 59(2):167-181.