因为开学实验室事情挺多,已经好久没有上线更新,最近老师让看的论文Jianbo Shi and Jitendra Malik的《Normalized Cuts and Image Segmentation》,记录一下自己的理解。
一、解决问题
作者提出Normalized cut(归一化分割) 改善了Min-cut(最小割)倾向于分割图像中孤立结点的问题。以下图说明:
对上图理想的分割情况是以中间的竖直虚线进行分割,但最小割却容易将n1和n2这两个孤立点分割出来,主要是由于最小割并未考虑像素点之间的全局相关性。
二、Normalized cut
Ncut从图论的角度看,其基本思想是:把一个图像看成一个图(Graph), 计算图像的权重图(Weighted graph),然后利用权重图将图像分割成一些具有相同特征(纹理, 颜色,明度等)的区域。可见,权重的构建极为重要。
2.1 权重图
任意特征空间中的点集表示为加权无向图 G(V,E),其中V表示顶点,E表示边缘。图的节点是特征空间中的点,每对节点之间形成一条边。每个边上的权重w(i,j)是节点i和j之间的相似性函数。我们希望顶点集之间的边,其权值的和更小。如图所示:
2.2 Ncut
计算总公式为:
其中,
同理,类推B部分。这里不详细介绍论文给出的整个推理求解最优解的过程,但给出以下基本步骤:
1)设计权重矩阵W,矩阵中的每个数值能够表征像素间的差异或者图像特征
2) 计算对角矩阵D,D的对角线上的元素为:
3)求解公式,计算相应的特征向量:
u为待求解。
2.3 实验结果
作者放出源码,并在2002年对这篇发于1997年的论文进行改进。程序在Matlab上,采用的是最小第二特征向量(论文中说第一个为0),可以指定需要分割区域的个数,结果如下(这里应该还用了均值聚类之类的得到结果图):
这里指定Number=10。
三、总结
小白看论文总是云里雾里,老师也给出了很多见解,尤其是数学推论求解那部分。如果大家感兴趣可以去看看,这篇文章算是图像分割一个重要的转折点,毕竟用彩色图啦!李飞飞课程第一堂里面也有提到!如果有错误,欢迎大家指正!