1.聚类问题可分为Compactness和Connectivity
2.Compactness只能处理凸集,典型是K-means
3.Connectivity典型代表是谱聚类,它是带权重的无向图
4.谱聚类利用切图原理寻找优化函数
5.引入指示向量Y、度矩阵D、邻接矩阵W来化简目标函数
上一篇聚类算法(K-means)我们介绍了K-means聚类算法,实际上,聚类问题可以分为两种思路:第一种是Compactness,这类算法只能处理凸集,GMM就属于这种;第二种是Connectivity,能很好处理非凸集,这类的代表就是谱聚类(Spectral Clustering),这一篇我们就介绍这个聚类算法。
模型介绍
谱聚类是一种基于带权重的无向图方法,它也是一种概率图模型。这个图用G=(V,E)表示,V是所有顶点的集合,E是边的集合。比如下面的无向图:
V是所有样本的集合,E代表两两样本的权重:
由于是无向图,所以<