数据挖掘笔记-聚类-SpectralClustering-原理与简单实现

人生偌只如初见

已于 2023-01-30 18:36:07 修改

阅读量3.9k

点赞数 1

分类专栏： DataMining 文章标签：数据挖掘聚类谱聚类 Spectral 拉普拉斯

于 2014-09-02 15:42:10 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fighting_one_piece/article/details/39006957

版权

谱聚类是一种基于图论的聚类方法，通过构造图的拉普拉斯矩阵并进行特征分解，能识别任意形状的样本空间。算法包括构造邻接矩阵、求拉普拉斯矩阵、获取特征向量并使用K-Means聚类。相较于传统聚类方法，谱聚类更健壮，尤其适合处理高维稀疏数据，计算复杂度较低。

摘要由CSDN通过智能技术生成

谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或两个以上的最优子图，使子图内部尽量相似，而子图间距离尽量距离较远，以达到常见的聚类的目的。其中的最优是指最优目标函数不同，可以是Min Cut、Nomarlized Cut、Ratio Cut等。谱聚类能够识别任意形状的样本空间且收敛于全局最优解，其基本思想是利用样本数据的相似矩阵(拉普拉斯矩阵)进行特征分解后得到的特征向量进行聚类。

Spectral Clustering 算法步骤：

1）根据数据构造一个Graph，Graph的每一个节点对应一个数据点，将相似的点连接起来，并且边的权重用于表示数据之间的相似度。把这个Graph用邻接矩阵的形式表示出来，记为 W。

2）把W的每一列元素活者行元素加起来得到N个数，把它们放在对角线上（其他地方都是零），组成一个N*N的度矩阵，记为D 。

3）根据度矩阵与邻接矩阵得出拉普拉斯矩阵 L = D - W 。

4）求出拉普拉斯矩阵L的前k个特征值（除非特殊说明，否则“前k个”指按照特征值的大小从小到大的顺序）以及对应的特征向量。

5）把这k个特征（列）向量排列在一起组成一个N*k的矩阵，将其中每一行看作k维空间中的一个向量，并使用 K-Means算法进行聚类。聚类的结果中每一行所属的类别就是原来Graph中的节点亦即最初的N个数据点分别所属的类别。

示例

Spectral Clustering 和传统的聚类方法（如 K-Means等</

最低0.47元/天解锁文章

人生偌只如初见

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人生偌只如初见 CSDN认证博客专家 CSDN认证企业博客

码龄16年

153: 原创

2万+: 周排名

1万+: 总排名

50万+: 访问

: 等级

6046: 积分

608: 粉丝

180: 获赞

138: 评论

311: 收藏

私信

关注

热门文章

分类专栏

NebulaGraph 2篇
Doris 1篇
DataMining 49篇
Python 33篇
J2EE 26篇
ElasticSearch 14篇
Spark 12篇
XXL-JOB 3篇
Neo4j 4篇
Flink 2篇
Hadoop 6篇
ES-Hadoop 2篇
HBase 6篇
Hive 3篇
Tez 2篇
Kafka 5篇
Storm 3篇
JStorm 1篇
Tachyon 2篇
Oozie 1篇
Cassandra 1篇
Titan 2篇
Lucene 1篇
Redis 4篇
MongoDB 3篇
Akka 1篇
DataX 3篇
Crawler 4篇
Docker 3篇

最新评论

Java学习笔记-EXCEL文件的读写操作
qq_27475765: String sheetId = "rId1"; 这个rld1是怎么知道的。
Sanic学习笔记-搭建简单WEB基础框架
jeffreyshou: 老大，《Sanic学习笔记-搭建简单WEB基础框架》完整代码有吗？想学习下，谢谢
ElasticSearch学习笔记-Vector向量搜索记录
jasstion: 搜索速度会根据数据规模线性增加，如果数据量大的话，不太可行，可以参考基于elasticsearch实现大规模向量检索这篇csdn博客，将向量搜索转成全文检索，搜索速度以及效率大大提升。
Neo4j学习笔记-Embedded嵌入模式简单示例
rainysky7: 请问作者有NEO4J的学习资源嘛，我想付费获取。最近在做一个用java开发后端的小项目，需要用NEO4J来做数据库，用java操作Neo4j，想找资料学习
Sanic学习笔记-搭建简单WEB基础框架
LaoYuanPython: 有幸阅读博主才出炉不到2天的大作！谢谢博主提供的案例代码分享!如此好文,点赞感谢！欢迎博主到本人的Python专栏来交流！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。