变分推理ELBO详解

置顶 Quanato

已于 2023-12-19 17:08:06 修改

阅读量1.8k

点赞数 12

文章标签：机器学习深度学习算法人工智能神经网络

于 2023-12-18 21:37:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73784868/article/details/135071484

版权

本文介绍了先验概率和后验概率的基本概念，重点阐述了如何通过ELBO（证据下界）近似后验概率，包括利用贝叶斯定理和KL散度计算。变分推理的核心是通过参数化的概率函数逼近真实后验，以处理复杂模型中的隐变量问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一. 基础知识

1. 先验概率&后验概率

二. ELBO详解

1. 求取后验概率的概率论基本方法(ELBO出现的原因)

通过贝叶斯定理求后验概率

求联合概率p(x,z)替代后验概率

二. 通过ELMO近似后验概率

1. 设一个z的先验概率分布函数来近似后验概率

2.利用KL散度计算所设概率函数和后验概率的相似度

一. 基础知识

1. 先验概率&后验概率

x的先验概率分布：已知样本x的真实分布概率。可以理解为观测到的图片样本。

后验概率分布：在真实样本概率分布的条件下的隐变量z的概率分布。可以理解为所观测到图片的类别等无法直接观测获得的隐藏变量。

二. ELBO详解

1. 求取后验概率的概率论基本方法(ELBO出现的原因)

通过贝叶斯定理求后验概率

但是因为p(x)作为边缘概率因为是联合概率积分且很难直接计算所以非常的棘手

求联合概率p(x,z)替代后验概率

因为联合概率正比于后验概率(k = p(x), p(x)作为先验概率是常数)所以可以大致推导出后验概率的趋势。

但是由于实际上还是存在较大差异所以并不能用联合概率来替代后验概率

2. 通过ELMO近似后验概率

1. 设一个z的先验概率分布函数来近似后验概率

2.利用KL散度计算所设概率函数和后验概率的相似度

ELBO: 这里log p(x)是常数,也就是越接近到下界(elbo)的时候所设函数q越接近后验概率

3. 计算ELBO

可以直接通过求导来计算出最大化ELBO因为最终参数只有 $\theta$ , 这里的例子较为简单,但是实际情况是无法计算出解析解的。

三. 结论

1. 变分推理(elbo)就是将一个可以计算可以参数化的概率函数去近似真实的后验概率

2. 推理可以理解为通过一个被观测对象来推理相关隐变量后验概率密度分布的隐变量图模型

3. 隐变量可以理解为观测变量的属性或者特征,可以通过隐变量来提升模型对可观测变量的理解

博客等级

码龄3年

25
原创

301
点赞

355
收藏

234
粉丝

关注

私信

热门文章

分类专栏

手撸AI 专栏

最新评论

Uiautomator2与weditor配置一直报错咋办
黄鹏_Ted: 你好我的weditor 一直用不了可以帮我看看是啥原因吗兄弟
手撸AI-4: Accelerate库分布式训练详解
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
关于Couldn‘t find MySQL server (/usr/local/mysql/bin/mysqld_safe)
CSDN-Ada助手: 非常感谢您分享这篇博文，对于遇到类似问题的读者来说会非常有帮助。希望您能继续坚持创作，分享更多关于MySQL和其他技术方面的知识和经验。另外，除了更改执行权限，也可以通过检查文件所属用户和用户组、查看系统日志等方式来进一步排查和解决类似的问题。希望这些信息对您有所帮助，期待您未来的更多精彩内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
VMLoc模型解读和原理分析
CSDN-Ada助手: 恭喜作者撰写了第20篇博客《VMLoc模型解读和原理分析》，对于深入研究和分享这一主题表示钦佩。希望作者能继续保持创作的热情，不断探索更多前沿的技术和理论，为读者带来更多有价值的内容。或许下一步可以考虑结合实际案例或者应用场景，将理论知识更贴近实际，让读者更易于理解和应用。期待作者的下一篇作品。
RINCE ------- 对比损失（InfoNCE）升级版
CSDN-Ada助手: 恭喜作者完成第17篇博客！标题也非常吸引人，对比损失（InfoNCE）升级版确实是个引人注目的主题。通过您的博客，我对RINCE有了更好的了解。您的解释非常清晰，让我容易理解了该算法的原理和应用。不过，如果可能的话，我希望您在下一篇博客中能够更深入地探讨该算法的优缺点以及与其他相关算法的对比。这样的比较将使读者更全面地了解该领域的最新进展。期待您未来更多的创作！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。