VARIATIONAL IMAGE COMPRESSIONWITH A SCALE HYPERPRIOR 中的公式推导

Lynxse

于 2023-10-21 23:51:03 发布

阅读量138

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Lynxse/article/details/133967680

版权

本文作者回顾了端到端图像压缩模型中的VAE（变分自编码器）推导过程，重点讲解了从后验分布的KL散度出发，澄清了公式中的误解，并指出p(x)作为常数项的特性。作者承诺后续会继续分享更多公式推导细节，期待读者指正.

摘要由CSDN通过智能技术生成

入学以来看了几篇端到端的图像压缩模型的文章，但一开始心浮气躁，也看不下去公式，最近看到了几篇关于VAE变分自编码器推导过程，就又把看过的文章拿出来重新看了，也终于能看懂其中一些公式是怎么来的了，就在这里记录一下公式推导和注解吧。

有关VAE推导的文章可以看这些，讲的非常好：

文章中的公式(3)如下：

每一项是如何获得的呢，首先从后验分布的拟合概率q和实际概率p的KL散度出发：

一开始我误把散度写成了二重积分，然后发现怎么推导结果都对不上，后来才发现，这里并不是联合分布，只要对y积分就可以，然后对它继续化：

对比最终的3式可以发现，p(x)这项没了，这是因为p(x)是一个确定的，存在的分布，只是我们写不出它的表达式而已，所以它在这里就直接被固定为了常数项。再根据论文中的解释，分别看每项的含义即可。目前先更新到这里，有时间的话会其余公式的推导的，由于本人水平有限，如果有什么错误，也请各位批评指正。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。