K-means聚类算法-----------机器学习

k均值算法是我们学习聚类算法的第一种算法,前面我们介绍了聚类任务以及聚类任务的性能度量,但是还没有介绍具体的算法,今天我们从k均值算法开始说起,前面的博文中我们提到了EM算法,其实k均值算法中也带有EM算法的思想,我们一步一步来看。

k均值算法

给定样本集D=\{\textbf{x}_1,\textbf{x}_2,...,\textbf{x}_m\},那么k均值算法是如何将这些样本集划分为k个类别也就是k个簇C=\{C_1,C_2,...,C_k\},任何一种算法想达到某种效果,都需要有一个性能度量来衡量我这个算法最后聚类结果是否使我们满意的,那么这里k均值算法采用的是最小化同一个簇里面样本到簇中心的距离:

其中\boldsymbol{\mu}_{i}=\frac{1}{\left|C_{i}\right|} \sum_{\boldsymbol{x} \in C_{i}} \boldsymbol{x}是簇C_i的均值向量,这个式子直白的理解就是簇内样本围绕簇均值向量(簇中心)越紧密越好,和我们之前说的簇内相似度要最高,在这个式子中

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值