第32课:谱聚类——无需指定簇数量的聚类

谱聚类是一种无需预先指定簇数量的聚类方法,尤其适用于无法确定簇数的场景。算法通过图切割和谱分析来实现聚类,避免了KMeans等方法对k的依赖。主要步骤包括构建图、计算拉普拉斯矩阵、求解特征向量等。通过对拉普拉斯矩阵的第二大特征值对应的特征向量进行处理,可以将数据点划分到不同的簇中。
摘要由CSDN通过智能技术生成

无须事先指定簇数量的聚类

说到聚类,最常见的模型当然是 KMeans。不过如果使用 KMeans 的话,需要在算法运行前指定 $k$ 的值——也就是要在训练前指定最后的结果被分为几簇。

现实中有相当多的聚类问题,无法在事先指定簇的数量。KMeans 就无法完成这类任务。

好在聚类方法有很多,有一种算法,不仅不需要事先指定 $k$ 值,还可以在结果中保证每个簇中的个体数量低于某个量值,这就是——基于图切割的谱聚类(Spectral Clustering)

算法实现

基于图切割的谱聚类算法过程分为两个大的步骤:

  1. 图切割
  2. 谱聚类

具体步骤如下:

Step 1:生成一张图 $G = <V,E>$,其中每个顶点(Vertex)对应一个样本对象,每两个顶点之间的边则代表这两个样本之间的距离。

此处的距离可以是欧氏距离、余弦距离,或者任何一种距离,我们用 $c_{ij}$ 表示顶点 $i$ 和顶点 $j$ 之间的距离,那么这张图就可以用矩阵 $C$ 来表示了:

$C = (c_{ij}) $

Step 2:确定距离阈值 $threshold_C$

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

叶锦鲤

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值