机器学习实战之k-means

一头食量超大的小猪

于 2016-04-18 14:53:35 发布

阅读量753

点赞数

分类专栏：机器学习实战系列文章标签： k-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_17451213/article/details/51179602

版权

本文介绍了k-means聚类算法，包括聚类和分类的区别、k-means的工作原理、算法流程、代码实现、聚类质量评估以及对局部最小值问题的解决方案——二分k-均值算法。通过对SSE的分析，展示了如何优化聚类效果。

摘要由CSDN通过智能技术生成

1. 分类和聚类

分类的目标事先已知，聚类产生的结果和分类一样，但是其类别没有预先定义。聚类是无监督的，无监督学习没有训练过程。

聚类分析就是将相似对象归入同一簇，不相似对象分到不同簇。相似取决于所选择的相似度计算方法，算法性能将会受到相似度计算方法的影响。

2. k-均值聚类算法

（1）定义

k-means是发现给定数据集的k个簇的算法。簇个数k用户指定，每一个簇通过其质心即簇中所有点的中心来描述。

（2）工作过程

创建k个点作为起始质心（一般是随机选择或者也可以从数据集中随机选择k个样本）

当任意一个点的簇分配结果发生改变时

对数据集中的每个点

对每个质心

计算质心与该数据点之间的距离

将该数据点的簇更新为距离最小的簇

对每个簇，通过计算簇中所有数据点的均值来更新簇的质心

（3）实现代码

最低0.47元/天解锁文章

一头食量超大的小猪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一头食量超大的小猪 CSDN认证博客专家 CSDN认证企业博客

码龄10年

157: 原创

19万+: 周排名

134万+: 总排名

8万+: 访问

: 等级

2292: 积分

13: 粉丝

8: 获赞

3: 评论

32: 收藏

私信

关注

热门文章

分类专栏

最新评论

机器学习实战之PCA
#wr: 建议考虑一下T怎么用的，这样用不太严谨
机器学习实战之SVD
循环是人递归是神: xformedItems = dataMat.T * U[:,:4] * Sig4.I # 将数据转换到低维空间请教下博主，这里的xformedItems不是A=U*sigma*V'中的V吗？只是一个变换矩阵啊。我觉得dataMat*V才是将数据转化到低维空间了。
机器学习实战之SVD
呆呆的猫: 博主好，为什么图像压缩的时候按照上文的程序输出是列向量

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。