K-均值聚类(K-means)算法

        聚类算法,是一种无监督的学习方法,他将相似的对象归到统一簇中,簇内的对象越相似,聚类效果也就越好,我们用簇识别表示给出聚类结果的含义。他有点像全自动分类,假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是什么;聚类和分类的最大不同在于,分类的目标事先已知,而聚类则不一样。因为其产生的结果与分类相同,而只是类别没有预先定义,聚类有时也被称为无监督学习。

        聚类算法的目的是将相似的对象聚到一起,所以我么就需要一个衡量对象相似度的方法。在机器学习中大多数都是用距离衡量对象之间的相似度的,聚类算法也是用距离来衡量。

  • K-均值聚类算法

        K-均值聚类算法,是从给定的数据集的k个簇。簇个数k是用户给定的,每一个簇通过其质心,即簇中所有点的中心来描述。点与点之间的相似度计算,和KNN算法一样,我们用欧式距离来衡量。也可以用其他自己喜欢的距离度量方法。

        其算法的基本思路及过程如下:

  1. 随机确定k个点作为初始的质心;
  2. 分别计算集合中的点到这k个质心距离,并将每个点归到距离其最近的那个质心所在的簇;如果所有点所属的簇都没发生改变,则到步骤(4)
  3. 分别计算2中生成的k个簇中所有点的均值,并将其作为新的质心。并返回步骤(2)。
  4. 返回所有簇的质心。聚类结束。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值