EM算法的推导

0. Jensen不等式

这里不做证明,只列举下文要用到的结论

f(x)[a,b]上为凸函数,即f''(x)<0时,

f(E(X))\geq E(f(X)),当且仅当X为常量时去等号(即a=b)

1. EM推导

设样本集(X_i,Y_i),i=1,2,...,N,则似然函数的对数形式为:

l = \sum _ilog(p(x_i,\theta ))

当含有隐变量z,则难以用MLE对\theta计算。

加入隐变量后,

l=\sum _ilog(\sum _zp(x_i,z_i,\theta ))

此时加入Q函数,作为z的某个分布,\sum _zQi(z_i)=1

l=\sum _ilog(\sum _zQ_i(z_i)\cdot \frac{p(x_i,z_i,\theta )}{Q_i(z_i)}) \geq \sum _i\sum _zQ_i(z_i)log(\frac{p(x_i,z_i,\theta )}{Q_i(z_i)})=J

因此我们通过不断调整参数\theta与变量z,使J不断逼近l

E步:

固定\theta,调整Q,使J=l(可以证明)。

有0节的取等条件可以得到,此时\frac{p(x_i,z_i,\theta )}{Q_i(z_i)}=C

对等式变换:

\sum _zp(x_i,z_i,\theta )=C\cdot \sum _zQ_i(z_i)

p(x_i,\theta )=C

Q_i(z_i)=\frac{p(x_i,z_i,\theta )}{p(x_i,\theta ))}=p(z_i|x_i,\theta )

M步:

固定Q_i(z_i),计算\theta

\theta =argmax_\theta (J)

参考:

[1] http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值