gmm中隐变量是什么的_高斯混合模型GMM

本文主要过程参考[1]

Motivation

先通过几组图片了解为什么需要使用GMM.

3f65db3f2cf66d38792775a4c9e614ea.png

从几何角度来看,有的数据分布,用多个高斯分布的加权平均来描述合理一些.

, 系数是一个权重,并且和为1,否则概率容易超过1.

89e507c9941413863f9536b6a8666b1d.png

从混合模型的角度来看,

是观测变量,
是隐变量, 代表样本
属于哪一个高斯分布. 所以
其实是一个离散的随机变量.

5897665f971d5bfbf14978850f8eb152.png

从生成过程来看, 用一个骰子投掷出z值从而确定样本所属分布,投掷N次就有N个样本了.

使用MLE估计参数

先推导如何消掉隐变量

做一些notation

使用MLE求参数

发现log里面有一个连加的符号, 这个是没有办法得到解析解的. 所以直接用MLE无法得出解析解. 解释可以参见[2]. 所以需要用数值解法比如梯度下降. 当然最流行的是EM算法.下面介绍EM算法.

EM 推导

EM的迭代公式如下:

先看E step, 令

单独研究中括号里面的公式

代入原式,有

现在就已经把E step求完了,现在开始M step.

:

这是约束优化,使用拉格朗日乘数法来解决.

对于

的最优化更简单,因为没有约束条件.

关于EM的算法的intuition,见<PRML>[3]

参考

  1. ^https://www.bilibili.com/video/BV13b411w7Xj?t=225
  2. ^<PRML> p433
  3. ^<PRML>,p450
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值