图像标定框提取算法Selective Search总结

Selective Search是一种图像标定框生成算法,应用于早期RCNN,通过Graph-Based Image Segmentation初步分割,再进行层次型分组和多样化策略合并区域,生成多样化的标定框。算法包括颜色、纹理、大小和填补四个特征的相似度计算,近年来已被RPN网络层替代。
摘要由CSDN通过智能技术生成

Reference:
[1] Uijlings, J.R.R., van de Sande, K.E.A., Gevers, T. et al. Int J Comput Vis (2013) 104: 154. https://doi.org/10.1007/s11263-013-0620-5

Selective Search[1] 是2013年提出的标定框生成算法,应用于初代RCNN网络中。其应用了Graph Based Image Segmentation的图像初步分割,并提出了一系列标准来囊括更多的标定框。虽然很古老,计算效率也很低下,近年已几乎被RPN网络层完全取代,但其原理简单易懂,思想也十分有趣。

关于Graph-Based Image Segmentation,可参考此文:
https://blog.csdn.net/m0_38002423/article/details/94593560

概述

基于Graph-Based Image Segmentation的分割之后,可以得到一系列较小的标定框,这显然对于实际物体检测是不够的。我们需要将分割的各部分以一定条件进行合并,从而生成新的标定框。总而言之,所产生的标定框能够满足多尺度性(All Scales),以及多样性(Diversification)。

Step 1:层次型分组(Hierarchical Grouping Algorithm)

(1)应用Image Segmentation初始化一系列分割区域,表示为: R = { r 1 , . . . , r n } R=\{r_1,...,r_n\} R={ r1,...,rn}
(2)对每一对相邻区域 ( r i , r j ) (r_i,r_j) ri,rj:计算其相似度,并存放到集合 S S S中。
(3)迭代过程,当 S S S不为空时:
首先考虑相似度最高的一对区域 s ( r i , r j ) = max ⁡ ( S ) s(r_i,r_j)=\max(S) s(ri,rj)=max(S),将其进行合并,可得 r t = r i ∪ r j r_t=r_i \cup r_j rt=rirj。由于新的区域 r t r_t rt诞生,将所有分别与 r i , r j r_i,r_j r

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值