Reference:
[1] Felzenszwalb, P.F. & Huttenlocher, D.P. International Journal of Computer Vision (2004) 59: 167. https://doi.org/10.1023/B:VISI.0000022288.19776.77
这篇文章阐述了一种传统的图像分割的方法,不需要任何的先验知识,原理也十分简单易懂。它是著名的标定框提取算法Selective search的基础。
Efficient Graph-Based Image Segmentation
这篇文献将图像的所有像素点视为一个无向图 G = ( V , E ) G=(V,E) G=(V,E)的节点,将各条边 e = ( v i , v j ) ∈ E e=(v_i,v_j)\in E e=(vi,vj)∈E对应于每一对相邻节点的连接。其权值 w ( v i , v j ) w(v_i,v_j) w(vi,vj)为相邻两个节点的差。
分割算法中,最极端的情况是将每个像素都视为一个子图。该算法的初始化将图像分割为单个像素,并逐步进行融合,形成越来越少但越来越大的分割区域。给出一些定义:
1、Internal Difference I n t ( ⋅ ) {\rm Int}(\cdot) Int(⋅)
定义 I n t ( C ) {\rm Int}(C) Int(C)为节点集 C C C的最小生成树(Minimum Spanning Tree,MST)的最大权值。记为:
I n t ( C ) = max e ∈ M S T ( C , E ) w ( e ) I n t ( C ) = 0 i f o n l y o n e n o d e {\rm Int}(C)=\max_{e\in MST(C,E)}w(e)\\ {\rm Int}(C)=0\ \ {\rm if \ only\ one\ node} Int(C)=e∈MST(C,E)maxw(e)Int(C)=0 if only one node
2、Component Difference D i f ( ⋅ ) {\rm Dif}(\cdot) Dif(⋅)
定义 D i f ( C i , C j ) {\rm Dif}(C_i,C_j) Dif(C