k-means与EM算法小结

本文对比了k-means和EM算法,k-means适用于聚类,而EM算法能处理更复杂的混合分布数据。k-means通过迭代更新簇中心,EM算法利用期望最大化(E-step和M-step)估计参数,尤其适合处理带有隐变量的数据集。
摘要由CSDN通过智能技术生成

        EM算法像是k-means的应用场景,比如双峰分布的数据,k-means方法,将其看成2-means聚类的方法处理场景。

        k-means算法,也被称为k-平均或k-均值,是一种广泛使用的聚类算法,或者成为其他聚类算法的基础。

       假定输入样本为,则算法步骤为:

        (1)选择初始的k个簇中心u1,u2,...,uk

        (2)将样本xi标记为距离簇中心最近的簇:

        (3)更新簇中心:

        (4)重复最后两步,直到满足终止条件。(迭代次数/簇中心变化率/最小平方误差MSE)

          思考:经典的K-means聚类方法,能够非常方便的将未标记的样本分成若干簇;但无法给出某个样本属于该簇的后验概率。

 

         从直观理解猜测GMM的参数估计

         随机变量X是有K个高斯分布混合而成,取各个高斯分布的概率为,第i个高斯分布的均值为。若观测到随机变量X的一系列样本,试估计参数

          建立目标函数

        由于在对数函数里面又有加和,我们没法直接用求导解方程的办法直接求得极大值。分成两步。

        第一步&#x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值