20150916谱聚类学习

最新推荐文章于 2021-12-26 20:14:41 发布

wyymoon

最新推荐文章于 2021-12-26 20:14:41 发布

阅读量546

点赞数

分类专栏： R语言文章标签：谱聚类

本文链接：https://blog.csdn.net/wyymoon/article/details/48493911

版权

1 篇文章 0 订阅

订阅专栏

什么是谱聚类？

谱聚类的思想是生成一个带权无向图G。G的每个顶点表示一个样本，连接顶点的边表示两个样本之间具有相似性，边的权值即样本之间的相似度大小。然后对图进行分割，使得不同组之间的边的相似度尽可能的小，组内边的相似度尽可能的大。因此，谱聚类需要解决两个问题：如何生成带权无向图G？如何对图进行分割？

如何生成带权无向图G？

由上述描述可知，G其实是一个表示样本间相似度的矩阵。它是一个对称矩阵，且对角线元素为0（自己与自己的相似度定义为0），将该相似度矩阵记为W。
计算相似度的公式有很多，可自行选择。但当样本较多时，一个样本可能和很多样本点具有相似性，造成矩阵繁琐庞大。因此，可根据情况保留与该样本点最为相似的K个值，其余舍弃，记为0。
如何对图进行分割？

在此过程中，引入了拉普拉斯矩阵。将图分割问题转换成拉普拉斯矩阵求解问题。详见谱聚类详解

谱聚类步骤