GMM与KMeans的关系

 

首先考虑EM算法求解GMM的E步:

GMM中,当协方差矩阵的对角线元素固定为无限接近0(代表着不确定性越来越小,无限接近确定)时, 的作用将消失,因为 这一项将为0或者1。所以 将会变为确定的0或者1,也就是说没有了概率,成为了确定类别。

那么这个类别是怎么确定出来的呢?

 的表达式是下面这个式子

而这个概率分布,在协方差矩阵 为对角阵时,正比于欧氏距离。(各个方向具有相同重要性的多元高斯分布的性质)

事实上,GMM模型也确实是将协方差矩阵限制为对角阵来进行EM求解的。

因此,类别的选择也就成了按照与该cluster均值点的距离的选择问题。这恰好就是KMeans所做的事情(按照离中心点)

----------------------------------------------------------------------------------------------------------------------------------------------------------------

M步:

各个cluster均值向量的更新:

上面一段已经讨论过,rik 在协方差矩阵对角线元素限制为无穷小的时候,退化为了确定的0或1.

因次一个cluster的均值向量的计算也就退化为了该cluster中的点(hard assignment)的均值。

这恰好也和KMeans一模一样。

------------------------------------------------------------------------------------------------------------------------------------------------------------------

综上,GMM限制协方差矩阵为对角阵,当对角线元素无穷小(不确定性也就无穷小)时,soft assignment的GMM模型也就退化为了hard assignment的KMeans模型

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值