图聚类

最新推荐文章于 2024-06-29 11:52:30 发布

wangqianqianya

最新推荐文章于 2024-06-29 11:52:30 发布

阅读量1.6w

点赞数 18

分类专栏：机器学习

本文链接：https://blog.csdn.net/wangqianqianya/article/details/103482708

版权

26 篇文章 6 订阅

订阅专栏

基于图的聚类。注意这里的图指的不是图片，而是顶点+边构成的图。

将样例用图表示，则通过对图中顶点的划分完成聚类。

图的表示

G(V,E) 表示无向图， $V=\left \{ v_{1},v_{2},..,{v_{m}} \right \}$ 为点的集合，E为边集，W为权重， $W_{ij}$ 表示节点 $v_{i}$ 、 $v_{j}$ 之间相似度

图的划分是将图完全划分成若干个子图，个子图无交集。

划分要求

损失函数

由划分要求，我们给出损失函数为，所以我们的目标就是最小化这个损失函数。

图的划分两种常用方法

这里着重讲解一下谱聚类算法。

是一种基于图论的聚类方法，通过对样本数据的拉普拉斯矩阵的特征向量进行分析来完成聚类。

算法流程

计算拉普拉斯矩阵 L 。L=D-W , 其中W为权重矩阵，W为对称矩阵，且主对角线元素都为0；D为度矩阵，Dij,当i!=j时为0，否则Dii为以i为一顶点的所有边权重之和；L为半正定矩阵（即所有特征值非负值），最小特征值为0，且对应的特征向量为单位向量 $[1,1,...,1]^{T}$
计算L的特征值与特征向量 $Ve=\left \{ v_{e1},v_{e2},...,v_{en} \right \}$
取出最小的前k个特征值对应的特征向量构成一个矩阵 $V=\left \{ v_{1},v_{2},...,v_{k} \right \}$ ,将矩阵的每一行看做一个样本点并对其进行K-means聚类，得到k个簇

(2)由计算L的次小特征向量：

，次小特征向量为

由聚类按其值的正负分成了两类。

对于给定的一组样例，如果要用谱聚类方法，我们首先要构建一个图G(V,E)出来。这样才能算出W。

对于图像数据，我们定义Wij为像素i与像素j之间的相似度。若图像是a*a的，则W为a^2 * a^2的

， i，j为第i和第j节点的像素值

关注