图像标定框提取算法Selective Search总结

最新推荐文章于 2024-07-10 11:48:22 发布

王红尘

最新推荐文章于 2024-07-10 11:48:22 发布

阅读量490

点赞数 1

分类专栏：图像处理

本文链接：https://blog.csdn.net/m0_38002423/article/details/96421950

版权

Selective Search是一种图像标定框生成算法，应用于早期RCNN，通过Graph-Based Image Segmentation初步分割，再进行层次型分组和多样化策略合并区域，生成多样化的标定框。算法包括颜色、纹理、大小和填补四个特征的相似度计算，近年来已被RPN网络层替代。

摘要由CSDN通过智能技术生成

Reference:
[1] Uijlings, J.R.R., van de Sande, K.E.A., Gevers, T. et al. Int J Comput Vis (2013) 104: 154. https://doi.org/10.1007/s11263-013-0620-5

Selective Search[1] 是2013年提出的标定框生成算法，应用于初代RCNN网络中。其应用了Graph Based Image Segmentation的图像初步分割，并提出了一系列标准来囊括更多的标定框。虽然很古老，计算效率也很低下，近年已几乎被RPN网络层完全取代，但其原理简单易懂，思想也十分有趣。

关于Graph-Based Image Segmentation，可参考此文：
https://blog.csdn.net/m0_38002423/article/details/94593560

概述

基于Graph-Based Image Segmentation的分割之后，可以得到一系列较小的标定框，这显然对于实际物体检测是不够的。我们需要将分割的各部分以一定条件进行合并，从而生成新的标定框。总而言之，所产生的标定框能够满足多尺度性（All Scales），以及多样性（Diversification）。

Step 1：层次型分组（Hierarchical Grouping Algorithm）

（1）应用Image Segmentation初始化一系列分割区域，表示为： $R=\{r_1,...,r_n\}$ 。
（2）对每一对相邻区域 $r_i,r_j）$ ：计算其相似度，并存放到集合 $S$ 中。
（3）迭代过程，当 $S$ 不为空时：
首先考虑相似度最高的一对区域 $s(r_i,r_j)=\max(S)$ ，将其进行合并，可得 $r_t=r_i \cup r_j$ 。由于新的区域 $r_t$ 诞生，将所有分别与 $r_i,r_j$