2020-4-15 深度学习笔记19 - 近似推断 3 (变分推断和变分学习-离散型/连续型变量，变分法,学习和推断之间的相互作用)

最新推荐文章于 2024-04-18 10:34:21 发布

没人不认识我

最新推荐文章于 2024-04-18 10:34:21 发布

阅读量1.3k

点赞数

分类专栏：深度学习 IT 文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42555985/article/details/105526816

版权

第十九章近似推断 Approximate Inference中文英文2020-4-13 深度学习笔记19 - 近似推断 1 (把推断视作优化问题-证据下界，期望最大化EM-最大化下界 )2020-4-14 深度学习笔记19 - 近似推断 2 (最大后验推断MAP和稀疏编码 )变分推断和变分学习Variational Inference and Learning关于变分推断可以参考ht...

摘要由CSDN通过智能技术生成

第十九章近似推断 Approximate Inference

2020-4-13 深度学习笔记19 - 近似推断 1 (把推断视作优化问题-证据下界，期望最大化EM-最大化下界 )
2020-4-14 深度学习笔记19 - 近似推断 2 (最大后验推断MAP和稀疏编码 )

变分推断和变分学习Variational Inference and Learning

关于变分推断可以参考https://zhuanlan.zhihu.com/p/48713461

变分学习的核心思想就是在一个关于 $q$ 的有约束的分布族上最大化 $L$ 。选择这个分布族时应该考虑到计算 $E_q \log p(h,v)$ 的难易度。

一种常用的变分学习的方法是加入一些限制使得 $q$ 是一个因子分布：
$q(h∣v)=\prod_iq(h_i∣v)$
这被称为均值场方法。

变分方法的优点是我们不需要为分布 $q$ 设定一个特定的参数化形式。我们设定它如何分解，之后通过解决优化问题来找出在这些分解限制下最优的概率分布。

离散型潜变量：使用传统的优化技巧来优化描述分布 $q$ 的有限个变量。
连续型潜变量：使用一个被称为变分法的数学分支工具来解决函数空间上的优化问题。然后决定哪一个函数来表示分布 $q$ 。

变分法是”变分学习”或者”变分推断”这些名字的来因，尽管当潜变量是离散时变分法并没有用武之地。当遇到连续型潜变量时，变分法不需要过多地人工选择模型，是一种很有用的工具。我们只需要设定分布 $q$ 如何分解，而不需要去猜测一个特定的能够精确近似原后验分布的分布 $q$ 。

在学习算法中使用近似推断会影响学习的过程，反过来学习过程也会影响推断算法的准确性。
训练算法倾向于朝使得近似推断算法中的近似假设变得更加真实的方向来适应模型。

因为 $L(v,\theta,q)$ 被定义成 $\log p(v;\theta) - D_{\text{KL}} (q(h\mid v) \Vert p(h\mid v;\theta) )$ ，我们可以认为关于 $q$ 最大化 $L$ 的问题等价于（关于 $q$ ）最小化 $D_{\text{KL}}(q(h\mid v)\Vert p(h\mid v))$

最低0.47元/天解锁文章

没人不认识我

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
2020-4-15 深度学习笔记19 - 近似推断 3 (变分推断和变分学习-离散型/连续型变量，变分法,学习和推断之间的相互作用)

第十九章近似推断 Approximate Inference中文英文2020-4-13 深度学习笔记19 - 近似推断 1 (把推断视作优化问题-证据下界，期望最大化EM-最大化下界 )2020-4-14 深度学习笔记19 - 近似推断 2 (最大后验推断MAP和稀疏编码 )变分推断和变分学习Variational Inference and Learning关于变分推断可以参考ht...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。