spectral clustering谱聚类论文解读（上）

最新推荐文章于 2024-07-23 21:43:03 发布

濒临秃头的少女

最新推荐文章于 2024-07-23 21:43:03 发布

阅读量1.8k

点赞数 2

文章标签：聚类算法

本文链接：https://blog.csdn.net/selinaliujunlan/article/details/111351880

版权

关于A Tutorial on Spectral Clustering的解读

[论文](https://pan.baidu.com/s/1Q7h-WagYS_XXh3QYnK3RNg
提取码：o7tu
复制这段内容后打开百度网盘手机App，操作更方便哦)

1、介绍

相比与传统的聚类算法如k-means，single linkage,spectral clustering有更好的基础性优势。
single linkage：要提到AGNES，AGNES是一种自底向上的聚类方法，它把每个样本都看成一类，再把距离相近的类别进行合并，不断重复该过程，直到达到规定类别数。最近距离由两个类的最近样本决定(single linkage)，最远距离由两个类的最远样本决定（complete-linkage）。

2、相似图

原始问题是：由一些样点x₁,x₂,…x_n,和一些表示相似度的s_ij（s_ij 大于等于0)，聚类出相似的样本点，不相似的样本点彼此分开，于是引入相似图（G(V,E)）,当两点之间的相似度大于0或者大于某个阈值时，我们就把这两点连接起来，边的权重用s_ij表示。
然后问题转化为：将图划分为几个部分，使不同部分之间的边权重尽量小，每个部分内部的边权重尽量大。

2.1 图的标号

定义图G（V，E）是由样本点集V={v₁,v₂,v₃,…,v_n}组成的无向图，两个点之间的边权重是非负数，定义图的邻接矩阵W（w_ij）_{i,j=1,2,…,n}，当v_i和v_j之间没有边相连时，w_ij=0，同时因为是无向的，所以W是对称矩阵，即w_ij=w_ji。
定义节点的度为： $d_i=\sum_{j=1}^n w_{ij}$
定义度矩阵为D，是对角矩阵，D=diag(d₁,d₂,…d_n)
指示向量 $1_A$ =(f₁,f₂,f₃,…,f_n)^T $\in R^n$ ，当v_i在A中时，f_i=1，其他情况f_i=0
注意：下面我们用缩写 $\in A$ 表示{ $i$ | $v_i$ $\in A$ }
对于两个可能相交的子集合： $W(A,B):=\sum_{i\in A，j\in B} w_{ij}$
我们考虑两种方法来定义子集A的“大小”： $∣ A ∣ : = A 中点的数量$ $vol(A):=\sum_{i\in A} d_i$

2.2 不同的相似图

这里有一些流行的办法，能将给定的成对的相似点转化为相似图。先连接点，再对边加权。
1、 $\epsilon$ 邻域图
我们将距离小于 $\epsilon$ 的点连接起来，由于所有相似点间距离大致都为 $\epsilon$ ，所以这种对边进行加权的方法，并不能反映两点相似程度的差异，所以通常用这个方法处理无权图。
2、k近邻图
在连接时要构造无向的图（无向图才能使邻接矩阵W对称）有两种方法：
第一种方法是如果 $v{_{i}}$ 在 $v{_{j}}$ 的k个领域中或者 $v{_{j}}$ 在 $v{_{i}}$ 的k个领域中，则 $w{_{ij}}=w{_{ji}}$ 为 $v{_{i}}$ 与 $v{_{j}}$ 之间的距离，否则为 $w{_{ij}}=w{_{ji}}=0$ ；
在这里插入图片描述
第二种方法是如果 $v{_{i}}$ 在 $v{_{j}}$ 的k个领域中并且 $v{_{j}}$ 在 $v{_{i}}$ 的k个领域中，则 $w{_{ij}}=w{_{ji}}$

最低0.47元/天解锁文章

濒临秃头的少女

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
2
评论
spectral clustering谱聚类论文解读（上）

关于A Tutorial on Spectral Clustering的解读1、介绍2、相似图3、拉普拉斯图4、谱聚类算法本身5、切图6、随机游走的理解7、微扰理论方法8、谱聚类的实际问题9、谱聚类的拓展以及与谱聚类相关的文献1、介绍相比与传统的聚类算法如k-means，single linkage,spectral clustering有更好的基础性优势。single linkage：要提到AGNES：是一种自底向上的聚类方法，它把每个样本都看成一类，再把距离相近的类别进行
复制链接

扫一扫