摘要:
我们提出一种在计算机视觉中解决感知聚类问题的新方法。相对于那些关注图像数据中的局部特性及其一致性的方法,我们的目的是提取出一张图像的整体印象。我们将图像分割看作图像的分区问题并提出一种新的分割标准——“normalized cut”。这个标准既考虑组间的差异也会考量组内的整体相似度。本文还展示了如何利用基于广义特征值问题的有效计算方法来优化该标准。该方法不仅应用在静态图片,还应用在运动序列中,结果都很可观。
归纳总结:
1938_M. Werthemier提出在计算机视觉中“perceptual grouping”(感知聚类)和“organization”(组织)的重要性并列举了一些关键因素。
图像分割的目标:
利用亮度、颜色、纹理或者运动等属性的低级连贯性逐步构成分层的划分。
在对一张图像进行划分时,我们需要问一下两个问题:
1.什么是一个好的划分方法的标准?
2.这样划分的计算如何有效的实现?
1993_Wu and Leahy提出一种聚类方法,每次二分图像的时候使cut值最小,这样最后划分结束也就使最大的cut值最小化了。
缺陷:会切割出许多小的集合包含图中的一些孤立点。假设边的权重与节点间的距离成反比,那么下图中右侧的点在计算cut值时都会比左侧的点小。
因此,作者提出
normalized cut( Ncut)的概念。
采用这种方法得到的二分标准即:关联性组内最大,组间最小。
但最小化Ncut实际上是NP问题(Papadimitriou已证明),文中是在实数域求得近似离散解。
算法:
1. G=(V,E),计算每条边的权重,将结果赋给W(节点与节点间的权重)和D(节点与图中其他节点的权重总和);
2. 解方程式得到最小特征值对应的特征向量;
3. 利用第二小的特征值对应的特征向量并找到使Ncut最小的分割点来二分图像;
4. 通过检测cut值的稳定性判断本次分区是否还能继续细划分,并且确定Ncut要低于预先定义的值;
5. 如必要,迭代地重分已分割区域。
分割的组的数目由Ncut最大值确定。