谱聚类Spectral Clustering

谱聚类是一种利用数据相似度矩阵的特征值进行降维后在低维度空间进行聚类的方法。它旨在将数据集划分为内部相似度高、相互之间相似度低的不相交子集。通过构建KNN图、阈值图或完全连接图来描述数据点之间的邻接关系,并使用拉普拉斯矩阵进行谱分析,最后通过k-means算法进行聚类。
摘要由CSDN通过智能技术生成

Definition

spectral clustering techniques make use of thespectrum (eigenvalues) of thesimilarity matrix of the data to performdimensionality reduction before clustering in fewer dimensions. The goal of spectral clustering is to partition the dataset into disjoint subsets with high intra-cluster similarity and low inter-cluster similarity.

由此可见,谱聚类就是一个图分割问题。用无向图 描述 维空间的数据点集,其中每条边关联一个权值描述点之间的相似度,则图的邻接矩阵可用相似度矩阵 表示。

Similarity graph&matrix

维空间中,用一个相似度函数 描述两点之间的相似度,如用高斯核 计算相似度。相似度矩阵的构建过程就是描述数据点集中各数据点局部邻域关系图的过程,常用的构建方法有:

1.  K-Nearest Neighbor

     若的KNN邻接点,则

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值