python kmeans代码sse_Python机器学习算法之k均值聚类（k-means）

weixin_39890332

于 2020-12-03 14:29:00 发布

阅读量213

点赞数

文章标签： python kmeans代码sse

一开始的目的是学习十大挖掘算法(机器学习算法),并用编码实现一遍，但越往后学习，越往后实现编码，越发现自己的编码水平低下，学习能力低。这一个k-means算法用Python实现竟用了三天时间，可见编码水平之低，而且在编码的过程中看了别人的编码，才发现自己对numpy认识和运用的不足，在自己的代码中有很多可以优化的地方，比如求均值的地方可以用mean直接对数组求均值，再比如去最小值的下标，我用的是argsort排序再取列表第一个，但是有argmin可以直接用啊。下面的代码中这些可以优化的并没有改，这么做的原因是希望做到抛砖引玉，欢迎大家丢玉，如果能给出优化方法就更好了

一.k-means算法

人以类聚，物以群分，k-means聚类算法就是体现。数学公式不要，直接用白话描述的步骤就是：

1.随机选取k个质心(k值取决于你想聚成几类)

2.计算样本到质心的距离，距离质心距离近的归为一类，分为k类

3.求出分类后的每类的新质心

4.判断新旧质心是否相同，如果相同就代表已经聚类成功，如果没有就循环2-3直到相同

用程序的语言描述就是：

1.输入样本

2.随机去k个质心

3.重复下面过程知道算法收敛：

计算样本到质心距离(欧几里得距离)

样本距离哪个质心近，就记为那一类

计算每个类别的新质心(平均值)

二.需求分析

weixin_39890332

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。