Reference:
[1] Uijlings, J.R.R., van de Sande, K.E.A., Gevers, T. et al. Int J Comput Vis (2013) 104: 154. https://doi.org/10.1007/s11263-013-0620-5
Selective Search[1] 是2013年提出的标定框生成算法,应用于初代RCNN网络中。其应用了Graph Based Image Segmentation的图像初步分割,并提出了一系列标准来囊括更多的标定框。虽然很古老,计算效率也很低下,近年已几乎被RPN网络层完全取代,但其原理简单易懂,思想也十分有趣。
关于Graph-Based Image Segmentation,可参考此文:
https://blog.csdn.net/m0_38002423/article/details/94593560
概述
基于Graph-Based Image Segmentation的分割之后,可以得到一系列较小的标定框,这显然对于实际物体检测是不够的。我们需要将分割的各部分以一定条件进行合并,从而生成新的标定框。总而言之,所产生的标定框能够满足多尺度性(All Scales),以及多样性(Diversification)。
Step 1:层次型分组(Hierarchical Grouping Algorithm)
(1)应用Image Segmentation初始化一系列分割区域,表示为: R = { r 1 , . . . , r n } R=\{r_1,...,r_n\} R={
r1,...,rn}。
(2)对每一对相邻区域 ( r i , r j ) (r_i,r_j) (ri,rj):计算其相似度,并存放到集合 S S S中。
(3)迭代过程,当 S S S不为空时:
首先考虑相似度最高的一对区域 s ( r i , r j ) = max ( S ) s(r_i,r_j)=\max(S) s(ri,rj)=max(S),将其进行合并,可得 r t = r i ∪ r j r_t=r_i \cup r_j rt=ri∪rj。由于新的区域 r t r_t rt诞生,将所有分别与 r i , r j r_i,r_j r