【note】EM 算法

参考:《统计学习方法》第 9 章、《PRML》第 9 章

输入

观测变量数据 Y Y Y,隐变量数据 Z Z Z,联合分布 P ( Y , Z ∣ θ ) P(Y,Z|\theta) P(Y,Zθ) ,条件分布 P ( Z ∣ Y , θ ) P(Z|Y,\theta) P(ZY,θ)

目标

θ \theta θ 以极大化 L ( θ ) = log ⁡ P ( Y ∣ θ ) = log ⁡ ∑ Z P ( Y , Z ∣ θ ) L(\theta)=\log P(Y|\theta)=\log \sum_ZP(Y,Z|\theta) L(θ)=logP(Yθ)=logZP(Y,Zθ)

算法

Q ( θ , θ ′ ) = E Z [ log ⁡ P ( Y , Z ∣ θ ) ∣ Y , θ ′ ] = ∑ Z P ( Z ∣ Y , θ ′ ) log ⁡ P ( Y , Z ∣ θ ) Q(\theta,\theta')=E_Z[\log P(Y,Z|\theta)|Y,\theta']=\sum_ZP(Z|Y,\theta')\log P(Y,Z|\theta) Q(θ,θ)=EZ[logP(Y,Zθ)Y,θ]=ZP(ZY,θ)logP(Y,Zθ)

随机初始化 θ ( 0 ) \theta^{(0)} θ(0),每次迭代令 θ ( i + 1 ) = arg max ⁡ θ Q ( θ , θ ( i ) ) \theta^{(i+1)}=\argmax_{\theta}Q(\theta,\theta^{(i)}) θ(i+1)=argmaxθQ(θ,θ(i)) ,直到收敛

证明

B ( θ , θ ′ ) = L ( θ ) − D K L ( P ( Z ∣ Y , θ ′ ) ∥ P ( Z ∣ Y , θ ) ) = ∑ Z P ( Z ∣ Y , θ ′ ) log ⁡ P ( Y , Z ∣ θ ) P ( Z ∣ Y , θ ′ ) B(\theta,\theta')=L(\theta)-D_{KL}(P(Z|Y,\theta')\Vert P(Z|Y,\theta))\\ =\sum_ZP(Z|Y,\theta')\log \frac{P(Y,Z|\theta)}{P(Z|Y,\theta')} B(θ,θ)=L(θ)DKL(P(ZY,θ)P(ZY,θ))=ZP(ZY,θ)logP(ZY,θ)P(Y,Zθ)

arg max ⁡ θ B ( θ , θ ′ ) = arg max ⁡ θ Q ( θ , θ ′ ) \argmax_\theta B(\theta,\theta')=\argmax_\theta Q(\theta,\theta') θargmaxB(θ,θ)=θargmaxQ(θ,θ)

L ( θ ( i + 1 ) ) ≥ B ( θ ( i + 1 ) , θ ( i ) ) ≥ B ( θ ( i ) , θ ( i ) ) = L ( θ ( i ) ) L(\theta^{(i+1)}) \ge B(\theta^{(i+1)},\theta^{(i)}) \ge B(\theta^{(i)},\theta^{(i)}) = L(\theta^{(i)}) L(θ(i+1))B(θ(i+1),θ(i))B(θ(i),θ(i))=L(θ(i))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值