聚类模型
1、层次聚类
2、原型聚类-K-means
3、模型聚类-GMM
4、EM算法-LDA主题模型
5、密度聚类-DBSCAN
6、图聚类-谱聚类
六、图聚类-谱聚类
谱聚类是一种定义在图上的聚类算法,与其说是聚类算法,更是一种图的向量表示。基于向量表示之后,一般可以采用其他的聚类方法完成最后聚类结果。所以谱聚类的类表示既依赖于向量表示也与之后采用的聚类算法有关。
对于一个图 G G G,我们一般用点的集合 V V V和边的集合 E E E来描述。即为 G ( V , E ) G(V,E) G(V,E)。其中 V V V即为我们数据集里面所有的点 ( v 1 , v 2 , . . . v m ) (v_1,v_2,...v_{m}) (v1,v2,...vm)。 谱聚类根据图上节点之间的关系(关系度量: ϵ \epsilon ϵ邻域, k k k近邻图,全连接图),构建一个邻接矩阵来描述 m m m个节点之间的相似性:
W = [ w 11 w 12 . w 1 m w 21 . w 2 m . w i j . w m 1 w m 2 . w m m ] W=\begin{bmatrix} w_{11} &w_{12} &. &w_{1m} \\ w_{21}& . & & w_{2m}\\ .& & w_{ij} &.\\ w_{m1}&w_{m2} & .& w_{mm} \end{bmatrix} W=⎣⎢⎢⎡w11w21.wm1w12.wm2.wij.w1mw2m.wmm⎦⎥⎥⎤
由节点之间关系的对称性,显然相似性矩阵 W W W是对称矩阵。现在,我们希望学习到节点的向 量表示 x i , i ​ = ​ 1 , 2.. m x_{i},i\!=\!1,2..m xi,i=1,2..m,使得相似性越大的两个节点 i , j i,j i,j的向量表示 x i , x j ∈ R n x_{i},x_{j} \in R^{n} xi