机器学习之聚类和K-Means计算题

目录

K-Means聚类的步骤

计算题流程:

K-means性能评估指标:轮廓系数


K-Means聚类的步骤

k-means步骤:

随机设置K个空间内的点作为初始的聚类中心;

对于其他每个点分别计算到K个中心的距离,每个点选择最近的一个聚类中心点作为同一类;

每个点都聚类完毕后,重新计算出每个聚类的新中心点(计算平均值);

如果计算得出的新中心点与原中心点一样,那么结束,否则重新进行第二步

计算题流程:

第1次聚类:

(1)随机选择两个初始聚类中心,假设选P1和P2

(2)计算其它几个点到初始聚类中心的距离;

第一次聚类结果:簇A:P1 簇B:P2、P3、P4、P5、P6

第二次聚类:

首先计算每一簇聚类后的聚类中心;发现与原中心不一致,重新聚类。

第二次聚类结果:簇A:P1、P2、P3         簇B:P4、P5、P6

计算聚类中心坐标:XPA=(0+1+3)/3 = 1.33         XPB=(8+9+10)/3 = 9

                                YPA=(0+2+1)/3 = 1              YPB=(8+10+7)/3 = 8.33

AB两组新的聚类中心分别为:PA: (1.33, 1), PB: (9, 8.33)

例题:

K-means性能评估指标:轮廓系数

计算公式:

bi为i到其他簇的所有样本的最小平均值;ai为i到本身簇的距离平均值。

越接近1越好,越接近-1越不好

轮廓系数手算流程:假设:簇A:P1、P2、P3 簇B:P4、P5、P6

1)分别计算p1与p2和p3的距离,并计算平均值: a(p1)=(2.24+3.16)/2=2.7

(2)分别计算p1与p4、p5、p6之间的距离,并计算平均值: b(p1)=(11.31+13.45+12.20)/3=12.32

(3)计算p1的轮廓系数: s(p1)=(12.32-2.7)/12.32=0.78

(4)同理,计算p2,p3的轮廓系数分别为: s(p2)=(10.28-2.24)/10.28=0.78 s(p3)=(9.55-2.7)/9.55=0.71

(5)计算簇A中的轮廓系数的平均值: s=(0.78+0.78+0.71)/3=0.76

  • 11
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
共识聚类、NMF聚类K-means是常用的聚类分析方法,它们在算法原理和应用场景上存在一些差异。 1. 共识聚类(Consensus Clustering):共识聚类是一种集成聚类方法,它通过多次随机抽样和聚类操作来生成多个聚类结果,然后通过计算聚类结果之间的相似性来找到稳定的聚类结构。共识聚类能够解决传统聚类方法对初始化敏感的问题,提供更可靠和稳定的聚类结果。 2. NMF聚类(Non-negative Matrix Factorization):NMF聚类是一种基于矩阵分解的聚类方法,它可以对非负矩阵进行分解,得到两个非负矩阵的乘积表示原始数据。NMF聚类假设数据具有非负性和低秩性,对数据进行低秩近似表示,从而实现聚类操作。NMF聚类在文本挖掘、图像处理等领域有广泛应用。 3. K-means聚类K-means是一种基于距离的划分聚类方法,它将数据样本划分为K个簇,每个簇具有相似的特征。K-means聚类的目标是最小化各个样本点与所属簇的质心之间的距离平方和。K-means聚类具有简单、高效的优点,但对初始质心的选取敏感,可能会收敛到局部最优解。 综上所述,共识聚类通过集成多个聚类结果来提供稳定的聚类结构,NMF聚类利用矩阵分解对数据进行低秩近似表示,而K-means聚类则是一种基于距离的划分聚类方法。它们在算法原理和应用场景上存在差异,可以根据具体问题选择合适的方法进行聚类分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值