机器学习聚类算法之K-means

1.前言

         什么叫做聚类,这是一种典型的无监督机器学习算法。简单来说就是把相似度高的放到一堆。在这里我们关注的重点并不是特征和标签之间的关系,而是样本与样本之间的关系。

2.K-means聚类

         K-means是所有实现聚类的算法中最常用的一种,因为其简单,效果好。听到简单二字是不是觉得有点兴奋,如果学习也是一条食物链的话,那么像这些容易捕捉的猎物,简直就是初学者信心增长的能量之水。那么就一起来蔑视它,蹂躏它把!

         K就是我们最终要划分的簇数量,说人话就是要把数据划分为多少堆。其过程是这样的:在一堆数据中,先随机初始化K个簇心,将所有的点按照离簇心最近的原则划分为K个簇。选择每个簇中最中心的位置作为簇心,重新按照离簇心最近的原则分簇;直到所有点所属的簇都不再改变。

 3.  关键问题点

     3.1K的选择

                  通过上面的描述我们会有一个疑问,所谓的K-means中K的数量到底应该如何选择,  一堆陌生的数据本来就很使人头大,我怎么会知道它应该分成几堆呢?对不起,这个问题暂时还没有一个完美的解决方案。可行的解决方案就是试,多试几个,哪一个可以让你的boss满意,那就可以了。

      3.2初始化簇心

                      簇心的初始化,一般有一下几个方法:

                     1.随机初始化,直接任性的随机初始化K个点,数据量不是很大的情况下也看不出来什么。                           

                     2.轮盘法选择簇心ÿ

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值