机器学习:LDA_数学基础_5:变分推断:变分推断部分

  • 最优化量是一个泛函时,需要研究所有的输入函数,找到最大化或者最小化泛函的函数就是变分
  • 变分近似的过程:限制需要最优化算法搜索的函数的范围(二次函数,或者,固定基曲线函数的线性组合)

变分推断

  • 符号假设

    1. Z :所有的潜在变量和参数组成的集合
    2. X:所有的观测变量的集合
    3. 确定了联合分布 p(X,Z)
    4. 目标:找到后验概率分布 p(Z|X) , 验证模型证据 p(X) 的近似
  • 公式

lnp(X)=L(q)+KL(q||p)
其中
L(q)=q(Z)ln{p(X,Z)q(Z)}dZ
KL(q||p)=q(Z)ln{p(Z|X)q(Z)}dZ

  • 常规思路:EM算法
  • 新思路
    1. 在真实的概率分布进行操作不可以行的情况下(q(Z))不可操作
    2. 考虑 q(Z) 的受限类别
    3. 寻找这个类别中,是的KL散度达到最小值的概率分布

分解概率分布

  • 限制 q(Z) 的范围
    q(Z)=Mi=1qi(Zi)
    =>平均场论
    1. 在所有上述形式的 q(Z) 中寻找使得下届 L(q) 最大的概率分布
    2. 将上式带入 L(q)
    3. qj(Zj) qj

L(q)=iqi{lnp(X,Z)ilnqi}dZ

=qj{lnp(X,Z)ijqidZi}dZjqjlnqjdZj+

=qjlnp^(x,Zj)dZjqjlnqjdZj+

其中:

lnp^(X,Zj)=Eij[lnp(X,Z)]+

Eij[lnp(X,Z)]=lnp(X,Z)ijqidZi

结论

  • 上式中的 , qj{lnp(X,Z)ijqidZi}dZjqjlnqjdZj+ qj(Zj) p^(X,Zj) 之间KL的散度

所以最大化上式,等价于 最小化 KL 散度。且出现在 qj(Zj)=p^(X,Zj)

=>
lnqj(Zj)=Eij[lnp(X,Z)]+

得到因子 qj 的最优解的对数,需要求联合概率分布,然后取期望就可以。


分解近似的性质

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值