1.谱聚类概念
1.1基本概念
- 实对称阵的特征值是实数
- 实对称阵不同特征值对应的特征向量正交
- 谱:方阵作为线性算子,它的所有特征值的全体统称方阵的谱。
- 谱半径:方阵的谱半径为最大的特征值,矩阵A的谱半径为 (ATA) ( A T A ) 的最大特征值
- 谱聚类:一般来说,是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。
1.2相似度图G
1.2.1相似度图G的概念
- 给定一组数据
x1,x2,⋯,xn
x
1
,
x
2
,
⋯
,
x
n
,记任意两个点之间的相似度为
sij=<xi,xj>
s
i
j
=<
x
i
,
x
j
>
,形成相似度图:G=(V,E)。如果
xi
x
i
和
xj
x
j
之间的相似度
sij
s
i
j
大于一定的阈值,那么,两个点是连接的,权值记做
sij
s
i
j
。
利用相似度图来聚类的时候,要使得每一簇边的权值极小,簇内部的权值极大。 - 邻接矩阵:如果 vi v i 和 vj v j 之间的相似度 sij s i j 大于一定的阈值,则认为这两个点是连接的,满足条件的 sij s i j 则为 wij=0 w i j = 0 即表示这两个点未发生连接。这样 wij w i j 构成邻接矩阵W。
- 度矩阵:图G中某一点 vi∈V v i ∈ V 的度可以定义为: di=∑nj=1wij d i = ∑ j = 1 n w i j ,其中度矩阵 D=diag{d1,⋯,dn} D = d i a g { d 1 , ⋯ , d n }
- 子图: 图G的子图相当于全集的子集,也就是图G中的部分点构成的一个新的图。
①子图的指示向量:设置子图A的指示向量