谱聚类（Spectral Clustering）算法

最新推荐文章于 2024-07-29 16:10:39 发布

GeekStuff

最新推荐文章于 2024-07-29 16:10:39 发布

阅读量6k

点赞数

分类专栏： Algorithm MLDM 文章标签：谱聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aspirinvagrant/article/details/41700025

版权

谱聚类算法是一种基于图论的聚类方法，它将数据点视为图的顶点，通过相似矩阵构建最邻近图谱。该算法不易陷入局部最优，适合处理高维和非常规分布数据。主要步骤包括：建立相似矩阵、计算Laplacian矩阵、获取最小特征值及特征向量，最后使用Kmeans进行聚类。常见的相似度计算方法有余弦相似度和高斯函数，分割方法有最小分割法、规范化分割等。

摘要由CSDN通过智能技术生成

谱聚类算法由于其算法流程简单、计算简洁与 Kmeans 算法相比不容易陷入局部最优解，能够对高维度、非常规分布的数据进行聚类。谱聚类算法是利用图谱理论来进行算法分析，思想是把数据分析问题看成是图的最优分割问题，将数据样本看成是各个数据点，然后将数据点描绘成一个图表，根据图表关系计算出相应的相似矩阵，找到一种最优分割方法计算出相似矩阵的最小特征向量，最后利用相应算法得出最后的聚类结果。

谱聚类算法是将样本点看成为一个个顶点，将顶点之间用带权的边连接起来，带权的边可以看成是顶点之间的相似度。聚类从而可以看成如何分割这些带权的边，继而将聚类问题转化为怎么进行图分割的问题，但是如果这样的话新的问题又产生了，那就是怎样找到一种最优方法来划分这个图，才能使同组之间的样本权重尽可能高，不同组的权重尽可能的低。权重太低的边是多余的就要舍去，常用保留边的方法是要建立最邻近图谱，在最邻近图谱中每个顶点只与K 个相似度最高的点连接，其余的边是要舍弃的边。

建立最邻近图谱的方法就是把聚类问题转化为图分割的问题，转化之后就存在两个问题：（1）数据点与数据点之间的相似度的定义；（2）建立最邻近图谱之后要从哪条边或者从哪些边分割最优。

数据点之间的相似程度由边的权重表示，常用方法的有余弦相似度、高斯函数。

余弦相似度

高斯函数

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。