差分自编码器介绍、推导及实现

最新推荐文章于 2023-11-26 21:59:28 发布

VIP文章 Liu Zhian

最新推荐文章于 2023-11-26 21:59:28 发布

阅读量4k

点赞数 12

分类专栏： Coputer Vision VAE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37174526/article/details/101275920

版权

说在前面的话

最近几天在看VAE（variational auto-encoder）相关的资料，自己也是第一次接触到，在网上陆陆续续看了一些资料和视频，从看不懂，到迷迷糊糊，再到理解并用代码实现，这也花费了我将近两天的时间，所以，如果你也和我一样刚接触到，请耐心地多翻阅资料，看完本文并理解本文可能会需要花费你比较多时间。本文中，我会尽力把概念描述得更加intuitive，把数学公式推导过程列出，再最后对结果做一个解释。

如果有理解或表述不当，大家在评论下留言啦~ ?

0. 预备知识

0.1 信息量

在信息理论中，我们用以下式子来量化一个事件 $x$ 的信息量 $I (x)$ :

$I (x) = - l o g p (x) ， p (x) 为事件 x 发生的概率$

当 $l o g$ 底数为e时，信息量的单位为nat（奈特），当 $l o g$ 底数为2时，信息量的单位为bit（比特）。

0.2 信息熵（Entropy）

此外，如果用以下两个式子分别来表示随机变量 $X$ 在离散和连续情况下的信息熵 $H$ :
$H=\sum{-logp(x)*p(x)} \\ H=\int{-logp(x)*p(x)dx}$
信息熵可以看做是对信息量的期望。

0.3 K-L散度（Kullback-Leibler divergence）

K-L散度又被称为相对熵（relative entropy），是对两个概率分布间差异的非对称性度量。

假设 $p (x), q (x)$ 是随机变量上的两个概率分布，则在离散和连续随机变量的情形下，相对熵的定义分别为：
$KL(p(x)||q(x))=\sum{p(x)log\frac{p(x)}{q(x)}} \\ KL(p(x)||q(x))=\int{p(x)log\frac{p(x)}{q(x)}}dx$

注意！K-L散度不是对称的，它不是描述两个分布之间的距离，因为按照上述定义, $KL(p(x)||q(x))\ne KL(q(x)||p(x))$

0.4 贝叶斯公式（Bayes Rule）

这个就不多讲了，为了和下述的notation保持一致，公式表述如下
$p(z|x)=\frac{p(z,x)}{p(x)}=\frac{p(x|z)p(z)}{p(x)}$

最低0.47元/天解锁文章

关注

12
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
差分自编码器介绍、推导及实现

说在前面的话最近几天在看VAE（variational auto-encoder）相关的资料，自己也是第一次接触到，在网上陆陆续续看了一些资料和视频，从看不懂，到迷迷糊糊，再到理解并用代码实现，这也花费了我将近两天的时间，所以，如果你也和我一样刚接触到，请耐心地多翻阅资料，看完本文并理解本文可能会需要花费你比较多时间。本文中，我会尽力把概念描述得更加intuitive，把数学公式推导过程列出，再...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。