极简谱聚类(spectral clustering)

最新推荐文章于 2022-07-30 15:34:17 发布

billy145533

最新推荐文章于 2022-07-30 15:34:17 发布

阅读量457

点赞数

分类专栏：机器学习数据科学文章标签：谱聚类 SVD分解 spectral clustering

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/billy145533/article/details/112857829

版权

数据科学同时被 2 个专栏收录

38 篇文章 8 订阅

订阅专栏

20 篇文章 2 订阅

订阅专栏

谱聚类是基于矩阵SVD分解的一种聚类方法，就矩阵分解而言，并没有什么新奇的，但是利用矩阵分解来解决问题的思路值得研究一下

解决的问题

实现图的最佳分割

在这里插入图片描述

优化目标

切割目标，切割成本最小，分割后的数据规模差不多大。通俗的说，就是集群内部，节点联系尽量紧密，群集外部连接越少。
在这里插入图片描述

解决过程

步骤一

在这里插入图片描述

建立拉普拉斯矩阵（度矩阵-连接矩阵）这个矩阵第一个巧妙之处在于它的最小特征向量 $w_1 \propto (1,\cdots,1)$ ，这样后面的特征向量因为 $w_i^Tw_1=0,w_i$ 里面的元素必然有正有负，因此可以根据符号来聚类。而第二小的特征值对应的向量就是我们要求解的向量的，为什么求的是第二小特征向量呢？

步骤二

在这里插入图片描述
提出优化目标， $x$ 看作特征向量，上式的分母部分可以去掉。了解PCA的人对这个式子再熟悉不过。要使得这个式子最小，而又不能取最小的特征向量，那就只能取第二小的特征向量。那上式的分子部分的意义又是什么呢？

在这里插入图片描述
$x_i$ 是 $x$ 的第i个元素，直观的感觉是为了使得上式最小， $x_i,x_j$ 要尽量同号，就是同一个集群里面，如果非要不同号，选择那些 $x_i,x_j$ 的值比较小的会使得目标比较小。这样做切割，就符合了最优的切割方法。而是上式目标最小的就是 $w_2$ 。当然，这仅仅是一个近似最优，不过可以证明它是有界的，接近理论最优，因此可行。证明过程见参考文件
多聚类也差不多，不过要取多个特征向量对原拉普拉斯矩阵进行降维，降下来后用k-mean进行聚类。

参考文献

https://web.stanford.edu/class/cs224w/slides/05-spectral.pdf

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。