聚类结果不好怎么办_聚类算法

最新推荐文章于 2023-04-23 15:25:32 发布

weixin_39687621

最新推荐文章于 2023-04-23 15:25:32 发布

阅读量4.1k

点赞数

文章标签：聚类结果不好怎么办

k-means原理

给定的样本，按照样本距离的大小，将样本划分为k个簇，让簇内的点尽可能紧密的连在一起，簇间的的距离尽可能的大

假设簇的划分为（C1,C2.....CK）。目标最小化的平方误差E

其中ui是簇Ci的均值向量。质心

算法流程

K值的选取，交叉验证
初始化质心。对最后的聚类结果影响比较大。质心不能太近

从样本中选出k个初始的质心向量
计算周围样本点到质心的聚类。将距离较小额度覅归入所对应的类别。
重新计算各个簇的质心
回到2
知道达到最大的迭代次数或者K个质心的向量都没有发生变化，最后输出簇的划分结果

优化

K-Means++ 。首先选取一个点。计算样本点和该点的距离，选取最大作为第二个聚类中心。依次2迭代，直到选出K个聚类中心点
elkan K-means 。根据三角形的性质，优化距离的计算
大样本优化Mini Batch K-Means 用小样本做K-means。解决样本量大的问题。采用不同的随机采样得到聚类簇，选择其中最优的聚类簇

优点

原理简单、实现容易、收敛速度快
聚类效果良好
算法的解释性强
调参的簇数K

缺点

K值的选取不好把握
难收敛
数据不均横、异常点影响大
迭代，局部最优

参数调节

最低0.47元/天解锁文章

weixin_39687621

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
聚类结果不好怎么办_聚类算法

k-means原理给定的样本，按照样本距离的大小，将样本划分为k个簇，让簇内的点尽可能紧密的连在一起，簇间的的距离尽可能的大假设簇的划分为（C1,C2.....CK）。目标最小化的平方误差E 其中ui是簇Ci的均值向量。质心算法流程K值的选取，交叉验证初始化质心。对最后的聚类结果影响比较大。质心不能太近从样本中选出k个初始的质心向量计算周围样本点到质心的聚类。将距离较小额度覅归入所对应的类别。重新...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。