二分K-means聚类,K-Means改进

针对K-means算法可能收敛于局部最优的问题,本文介绍了二分K-means方法,通过SSE(误差平方和)度量聚类效果,并以实际数据集为例展示R语言实现过程。
摘要由CSDN通过智能技术生成

由于K-means 有可能会收敛到局部最优值,而无法收敛到全局最优值,影响聚类性能

一种用于度量聚类效果的指标是SSE(Sum of Squared Error,误差平方和),对应予 clusterAssment第二列

此算法的思想是,为克服K-均值算法收敛于局部最小值,我们使用二分K-均值:先将所有点作为一个簇,然后将该簇一分为二。之后选择其中一个簇继续进行划分,选择哪一个簇进行划分取决于是否可以最大程度降低SSE的值。上述基于SSE的划分过程不断重复,直到得到用户指定的簇数目为止

会用到我写的另一篇http://blog.csdn.net/skyonefly/article/details/50235735 ,[R语言实现K-Means算法数据集iris]

<span style="font-family:Comic Sans MS;font-size:14px;">#引入kmeans.r文件,以便调用其中自定义的函数
#详细见http://blog.csdn.net/skyonefly/article/details/50235735
source("E:/R programmer/kmeans.r")
#二分K-均值聚类算法
biKmea
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值