入门了解计算机视觉的一个分支——子空间学习,刚开始当然要从读论文开始。
最开始的一篇论文当然是图像分割的一个初始论文:
Normalized Cuts and Image Segmentation
——Jianbo Shi and Jitendra Malik, Member, IEEE
这里做一下学习笔记。
这篇论文针对于图像分隔的问题提出了一个基于图的图像分隔算法,比以往利用聚类的方法更加专注于全局解的情况,并且根据图像的亮度,颜色,纹理进行划分。
1.图像分割问题类比为图的分割问题
为什么能将图像分隔的问题类比为图的分割问题呢?
如果将图像中的每一个点当成图的一个点,这些像素点与像素点之间的边权表示为两个像素点属于同一个物体的像素度(转化为亮度则表示为亮度图片亮度相减的二范数越接近0说明越相似),这样就可以用这些像素点来构成一个图了。那么,图像分割的问题也变得简单了起来,我们以二分类为基础,每次都找到一个分割点,能将图二分。最后一直能够达到我们的目标。
2.目标函数(分割准则)
那么,当构成完这个图以后,又带来一个新的问题,如何进行分割,也就是如何找到最好的那个分割点
这就从我们刚刚的权重入手了,这里补充一个知识:
Fisher准则(具体应用在LDA降维上):在分类问题上,我们想要达到的一个目标是不同类与不同类之间的距离最大(相似度最小),类间点的距离最小(相似度最大),定义一个类间散度矩阵Sw,一个类内散度矩阵Sb,就可以得到一下的目标函数:
W表示我们的最优分隔平面,具体求解过程一般用拉格朗日乘子法转化为瑞利商问题,最后求最小特征值对应的特征向量,这里就不细说。
我们的图的分割也类似于这样的思想,因为点与点的边权代表着点与点的相似度。那么,我们要做的就是找到两个区域,其中一个区域的点到另一个区域的边权和最小,用式子表示出来就是: