广义EM算法(第十六周周报12.13-12.19)

本文回顾了EM算法的基本思想,探讨了在求解过程中遇到的困难,并详细解释了广义EM算法的原理。在广义EM中,通过将问题转化为优化问题,寻找最佳的隐变量分布q(Z∣θ)^和参数θ,以最大化对数似然函数ELBO。文章介绍了E-step和M-step的更新规则,以及如何处理无法直接求解P(Z∣X,θ)的情况。" 78721172,2820065,Java wait/notify/notifyAll 实战指南,"['Java', '多线程', '并发编程']
摘要由CSDN通过智能技术生成

一.回顾

此部分为原文https://blog.csdn.net/qq_16600319/article/details/121880698的回顾与补充:

  • 目标:根据观测到的数据假设服从某分布,求其分布的参数。

  • 输入: X = { x 1 , x 2 , … , x n } X=\{x_1,x_2,\dots,x_n\} X={ x1,x2,,xn};

  • 输出: θ \theta θ

  • M . L . E : θ ^ = arg ⁡ max ⁡ θ log ⁡ P ( X ∣ θ ) M.L.E:\hat \theta=\arg \max_\theta\log P(X\vert \theta) M.L.E:θ^=argmaxθlogP(Xθ)

  • 存在的困难:难以求出其解析解。

  • 相关概念:

    • Z = { z 1 , z 2 , … , z n } Z=\{z_1,z_2,\dots,z_n\} Z={ z1,z2,,zn}:隐变量
    • z i z_i zi K K K维向量, i = 1 , 2 , … , n i=1,2,\dots,n i=1,2,,n,分量的值为 K K K个分布所占的比例
  • EM: θ ( g + 1 ) = arg ⁡ max ⁡ θ ∫ Z log ⁡ P ( X , Z ∣ θ ) P ( Z ∣ X , θ g ) d Z \theta^{(g+1)} =\arg\max_\theta \int_Z\log P(X,Z \vert\theta)P(Z \vert X,\theta^{g})\mathrm{d}Z θ(g+1)=argmaxθZlogP(X,Zθ)P(ZX,θg)dZ

  • 混合高斯举例:

    • P ( X , Z ∣ θ ) P(X,Z \vert\theta) P(X,Zθ)
      P ( X , Z ∣ θ ) = ∏ i = 1 n P ( x i , z i ∣ θ ) = ∏ i = 1 n P ( x i ∣ z i , θ ) P ( z i ∣ θ ) = ∏ i = 1 n λ z i N ( x i ∣ μ z i , σ z i 2 ) P(X,Z \vert\theta)=\prod_{i=1}^nP(x_i,z_i|\theta)=\prod_{i=1}^nP(x_i|z_i,\theta)P(z_i|\theta)=\prod_{i=1}^n\lambda_{z_i}N(x_i|\mu_{z_i},\sigma^2_{z_i}) P(X,Zθ)=i=1nP(xi,ziθ)=i=1nP(xizi,θ)P(ziθ)=i=1nλziN(xiμzi,σzi2)

    • P ( Z ∣ X , θ g ) P(Z \vert X,\theta^{g}) P(ZX,θg)
      P ( Z ∣ X , θ g ) = ∏ i = 1 n P ( z i ∣ x i , θ g ) = ∗ ∗ λ z i N ( x i ∣ μ z i , σ z i 2 ) ∑ z i = 1 k λ z i N ( x i ∣ μ z i , σ z i 2 ) \begin{aligned}P(Z \vert X,\theta^{g})& =\prod_{i=1}^n P(z_i \vert x_i,\theta^{g})\\ &\overset{**}{=}\frac{\lambda_{z_i}N(x_i|\mu_{z_i},\sigma^2_{z_i})}{\sum_{z_i=1}^k\lambda_{z_i}N(x_i|\mu_{z_i},\sigma^2_{z_i})}\end{aligned} P(ZX,θ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值