谱聚类Spectral Clustering

Definition

spectral clustering techniques make use of thespectrum (eigenvalues) of thesimilarity matrix of the data to performdimensionality reduction before clustering in fewer dimensions. The goal of spectral clustering is to partition the dataset into disjoint subsets with high intra-cluster similarity and low inter-cluster similarity.

由此可见,谱聚类就是一个图分割问题。用无向图 描述 维空间的数据点集,其中每条边关联一个权值描述点之间的相似度,则图的邻接矩阵可用相似度矩阵 表示。

Similarity graph&matrix

维空间中,用一个相似度函数 描述两点之间的相似度,如用高斯核 计算相似度。相似度矩阵的构建过程就是描述数据点集中各数据点局部邻域关系图的过程,常用的构建方法有:

1.  K-Nearest Neighbor

     若的KNN邻接点,则

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
谱聚类spectral clustering)是一种基于图论的聚类算法,适用于无法使用传统聚类算法(如K-means)有效划分的数据。谱聚类的核心思想是将数据集转换成图形结构,利用图的谱分解来实现聚类。 在Python中,有一个常用的谱聚类库是scikit-learn的`SpectralClustering`。该库提供了一种简单且高效的方法来执行谱聚类。 使用`SpectralClustering`库进行谱聚类的步骤如下: 1. 导入库:首先需要导入`SpectralClustering`库。 ```python from sklearn.cluster import SpectralClustering ``` 2. 创建模型:使用`SpectralClustering`函数创建一个谱聚类模型对象,并传入相关参数。 ```python model = SpectralClustering(n_clusters=2, affinity='nearest_neighbors') ``` 其中,`n_clusters`表示需要聚类的簇数,`affinity`表示相似度的计算方法,常用的选项包括`nearest_neighbors`和`rbf`。 3. 训练模型:使用`fit`函数训练模型,传入需要进行聚类的数据。 ```python model.fit(data) ``` 4. 获取聚类结果:通过访问模型的`labels_`属性,可以获取到每个样本的聚类标签。 ```python cluster_labels = model.labels_ ``` 聚类标签是一个表示每个样本所属簇的数组。 总结来说,Python的谱聚类库提供了一个方便而有效的方式来执行谱聚类。通过导入库、创建模型、训练模型和获取聚类结果的步骤,可以轻松地使用谱聚类算法对数据进行聚类分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值