25 近似推断

文章探讨了为什么需要进行近似推断,特别是在有向图和无向图模型中遇到的困难。通过变分推断(VI)的方式,将推断问题转化为优化问题,利用期望最大(ELBO)和KL散度来近似log-likelihood,从而解决复杂的后验概率计算问题。
摘要由CSDN通过智能技术生成

25 近似推断

25.1 为什么要做近似推断

推断的目的是什么?

  1. 求出后验本身就是个问题
  2. 后验会用来学习参数,所以也是Learning问题的前提

推断为什么是困难的?

  1. 有向图:Explaining away——如果出现两个隐状态同时指向一个节点,则隐状态不相互独立,没法写出后验
  2. 无向图:mutual interaction

25.2 推断即优化

具体的近似推断形如VI-变分推断,在这一章中我们已经使用过,这里就简单复习一下。

我们可以将概率图模型中的推断问题转化成一个优化问题,这里我们简单推导来证明一下。首先我们已知目标是要求log-likelihood,假设 V V V表示样本, H H H表示隐状态。log-likelihood可以写作 ∑ v ∈ V log ⁡ P ( v ) \sum_{v \in V} \log P(v) vVlogP(v)。其中我们可以对 log ⁡ P ( v ) \log P(v) logP(v)进行一些数学变换:
log ⁡ P ( v ) = log ⁡ P ( v , h ) P ( h ∣ v ) = log ⁡ P ( v , h ) q ( h ∣ v ) + log ⁡ q ( h ∣ v ) P ( h ∣ v ) \begin{align} \log P(v) &= \log \frac{P(v,h)}{P(h|v)} = \log \frac{P(v,h)}{q(h|v)} + \log \frac{q(h|v)}{P(h|v)} \end{align} logP(v)=logP(hv)P(v,h)=logq(hv)P(v,h)+logP(hv)q(hv)
若此时我们在左右同时乘一个 q ( h ∣ v ) q(h|v) q(hv),并求积分,可以得到:
log ⁡ P ( v ) = ∫ q ( h ∣ v ) ⋅ log ⁡ P ( v , h ) q ( h ∣ v ) d h + ∫ q ( h ∣ v ) ⋅ log ⁡ q ( h ∣ v ) P ( h ∣ v ) d h = E q ( h ∣ v ) [ log ⁡ P ( v , h ) ] − E q ( h ∣ v ) [ log ⁡ q ( h ∣ v ) ] + K L ( q ( h ∣ v ) ∥ P ( h ∣ v ) ) = E q ( h ∣ v ) [ log ⁡ P ( v , h ) ] − H [ q ] ⏟ E L B O = L ( v , h , q ) + K L ( q ( h ∣ v ) ∥ P ( h ∣ v ) ) ⏟ K L ( q ∥ p ) \begin{align} \log P(v) &= \int q(h|v) \cdot \log \frac{P(v,h)}{q(h|v)} {\rm d}h + \int q(h|v) \cdot \log \frac{q(h|v)}{P(h|v)} {\rm d}h \\ &= E_{q(h|v)} \big[ \log P(v,h) \big] - E_{q(h|v)}\big[ \log q(h|v) \big] + KL \big( q(h|v) \Vert P(h|v) \big) \\ &= \underbrace{E_{q(h|v)} \big[ \log P(v,h) \big] - H[q]}_{ELBO = {\mathcal L}(v,h,q)} + \underbrace{KL \big( q(h|v) \Vert P(h|v) \big)}_{KL(q \Vert p)} \\ \end{align} logP(v)=q(hv)logq(hv)P(v,h)dh+q(hv)logP(hv)q(hv)dh=Eq(hv)[logP(v,h)]Eq(hv)[logq(hv)]+KL(q(hv)P(hv))=ELBO=L(v,h,q) Eq(hv)[logP(v,h)]H[q]+KL(qp) KL(q(hv)P(hv))

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值