【算法周】人以类聚咋个聚！K-means了解一下~(上篇）

最新推荐文章于 2019-12-03 23:23:37 发布

VIP文章哈希大数据

最新推荐文章于 2019-12-03 23:23:37 发布

阅读量335

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HashData2018/article/details/80724965

版权

欢迎关注哈希大数据微信公众号《哈希大数据》

上一周我们给大家讲了四篇机器学习的扫盲篇，把机器学习需要的一些常识以及需要的计算机环境理了一遍，这一周我们的系列名称是【算法周】！！毕竟算法是机器学习的灵魂嘛~~

今天我们给大家介绍算法的Chaper1——K-means~ 由于篇幅较长本次介绍分为上下两篇

K-Means算法是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。K-Means算法有大量的变体，本文就从最传统的K-Means算法讲起，在其基础上讲述K-Means的优化变体方法。包括初始化优化K-Means++, 距离计算优化elkan K-Means算法和大数据情况下的优化Mini Batch K-Means算法。
1.K-Means原理初探

K-Means算法的思想很简单，对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的大。

如果用数据表达式表示，假设簇划分为(C₁,C₂,...C_k)，则我们的目标是最小化平方误差E：

其中μ_i

最低0.47元/天解锁文章

哈希大数据

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【算法周】人以类聚咋个聚！K-means了解一下~(上篇）

欢迎关注哈希大数据微信公众号《哈希大数据》上一周我们给大家讲了四篇机器学习的扫盲篇，把机器学习需要的一些常识以及需要的计算机环境理了一遍，这一周我们的系列名称是【算法周】！！毕竟算法是机器学习的灵魂嘛~~今天我们给大家介绍算法的Chaper1——K-means~ 由于篇幅较长本次介绍分为上下两篇K-Means算法是无监督的聚类算法，它实现起来比较简单，聚类效果也不错，因此应用很广泛。K-Means...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。