自动编码器（VAE）的一些数学理解

最新推荐文章于 2024-06-07 09:55:50 发布

Yi Xiao[旺柴]

最新推荐文章于 2024-06-07 09:55:50 发布

阅读量313

点赞数

分类专栏： AI 文章标签：深度学习机器学习神经网络概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoyi_jason/article/details/115289976

版权

变分自编码器（VAE）是一种基于贝叶斯视角的深度学习模型，通过优化后验概率的近似表示来学习数据的潜在结构。本文详细介绍了KL散度、变分推断和VAE的基本模型，阐述了如何通过变分方法处理复杂的概率分布问题。在训练过程中，VAE面临后验失效问题，但仍然因其理论基础和可解释性而受到关注。此外，文章还讨论了VAE在图像生成等领域的应用及其优化技巧。

摘要由CSDN通过智能技术生成

Auto-Encoding Variational Bayes

Auto-Encoding Variational Bayes论文原文

再谈变分自编码器VAE：从贝叶斯观点出发

Understanding Variational Autoencoders (VAEs)

Variational Inference（传统算法总结的比较全面）

1 预备知识

1.1 KL散度及变分

相对熵（relative entropy）就是KL散度（Kullback–Leibler divergence）。用于衡量两个概率分布 $p (x)$ 和 $q (x)$ 之间的差异，定义为：

$KL(p(x)||q(x))=\int p(x)\ln{p(x)\over q(x)}dx=\mathbb{E}_{x\sim p(x)}\left[\ln{p(x)\over q(x)}\right]$

(1) 度量分布的近似度距离

KL 散度的主要性质是非负性:

如果固定 $p (x)$ ，那么 $KL(p(x)||q(x))=0\leftrightarrow p(x)=q(x)$ ;

如果固定 $q (x)$ ，同样 $KL(p(x)||q(x))=0\leftrightarrow p(x)=q(x)$ ;

也就是不管固定哪一个，最小化 KL 散度的结果都是两者尽可能相等。

(2) 正定性

Gibbis Inequality：

$KL(p(x)||q(x))\ne KL(q(x)||p(x)) \le 0$ 当且仅当p=q时取等号。

(3) 非对称性

由于 $p (x)$ 和 $q(x) 在公式中的地位不是相等的，因此:

$KL(p(x)||q(x))\ne KL(q(x)||p(x))$

(4) 奇异性

KL 散度存在’‘奇异状态’’，就是当 $q (x)$ 在某个区域等于 0，而 $p (x)$ 在该区域不等于 0，那么 KL 散度就出现无穷大。

若 $p (x)$ 是真实分布， $q (x)$ 是拟合分布，则拟合分布趋于覆盖理论分布的所有范围（zero avoiding）；

若 $q (x)$ 是真实分布， $p (x)$ 是拟合分布，则拟合分布的0值不影响KL散度的积分（zero forcing）。

2 基本模型

2.1 基本问题

如果我们有一组观测数据 $D$ ，如何推断产生这些数据的模型 $m$ （得到观测数据 $D$ 的分布）?

2.2 基本假设

设所有 $n$ 维概率分布函数构成的空间为 $\mathscr{P}_n$ 。给定正整数 $d$ ， $n$ 维数据集 $X=\{ x^{(i)} \}_{i=1}^N$ 是通过如下两步生成的：

（i）通过某个先验分布 $p^{*}(z) \in \mathscr{P}_d$ 生成 $d$ 维隐状态 $z^{(i)}$ ；

（ii）通过某个条件概率 $q^*_z(x) \in \mathscr{P}_n$ 生成 $n$ 维数据 $x^{(i)}$ 。(为了与函数族的写法相仿，这里条件分布用下标表示。)

注：这里的隐状态可以是连续性随机变量（如预测身高时将年龄作为隐状态），也可以是离散型随机变量（如预测身高时将性别作为隐状态）。

当先验分布与条件分布给定时，后验分布也已经确定（可以用Bayes公式算出）：

$p^*_x (z) = \frac{q^*_z(x) p^*(z)}{q^*(x)} = \frac{q^*_z(x) p^*(z)}{\int{q^*_z(x) p^*(z) dz}}$

最低0.47元/天解锁文章

Yi Xiao[旺柴]

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
自动编码器（VAE）的一些数学理解

Auto-Encoding Variational Bayes[https://arxiv.org/abs/1312.6114](Auto-Encoding Variational Bayes论文原文)https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/79801631[https://towardsdatascience.com/understanding-variational-autoencoders-vaes-f70510919f73]
复制链接

扫一扫

专栏目录

Yi Xiao[旺柴] CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

43万+: 周排名

53万+: 总排名

6278: 访问

: 等级

63: 积分

4: 粉丝

17: 获赞

14: 评论

55: 收藏

私信

关注

热门文章

分类专栏

高性能计算 1篇
笔记 2篇
AI 1篇

最新评论

通用矩阵乘法（GEMM）优化——基于arm neon
dashuzhineng: 博主是不是参考了这篇文章： https://renzibei.com/2021/06/30/optimize-gemm/ 那就是采用列主序那就没问题了
通用矩阵乘法（GEMM）优化——基于arm neon
dashuzhineng: 博主我感觉你的Step2以及Step3都是在进行B*A呀
通用矩阵乘法（GEMM）优化——基于arm neon
dashuzhineng: 我感觉4x4的也是B*A呀
通用矩阵乘法（GEMM）优化——基于arm neon
time and tide: 好文章，如果是row major呢
通用矩阵乘法（GEMM）优化——基于arm neon
2301_76233085: void matrix_mul_naive(int size, float *v0, float *v1, float *dst) { for (int i = 0; i < size; i++) // v0的行数 { for (int j = 0; j < size; j++) // v1的列数 { for (int k = 0; k < size; k++) // v0的列数 { dst[i * size + j] += v0[i * size + k] * v1[j + k * size]; } } } } 博主你的第一种写法是C=B* A吧。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Yi Xiao[旺柴] 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。