变分自编码器原理详解

最新推荐文章于 2024-06-26 12:34:34 发布

蓝色仙女

最新推荐文章于 2024-06-26 12:34:34 发布

阅读量736

点赞数

分类专栏：深度学习文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/weixin_37817275/article/details/118069389

版权

深度学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

变分自编码器

基本思想：VAE在2013年提出，假设数据 $x_i$ 是由一个随机过程产生的，该随机过程分为两步：

由先验分布 $P_{\theta^*}(z)$ 产生隐变量 $z_i$ ，
再由条件分布 $P_{\theta^*}(x|z_i)$ 产生数据 $x_i$ 。

$p_{\theta}(x_i)$ 可以表示为：
$p_{\theta}(x_i)=\int p_{\theta}(x_i|z)p_\theta(z)dz$
VAE的核心就是找到一个容易生成数据 $x$ 的 $z$ 的分布，即后验分布 $q_{\phi}(z|x)$ ，VAE需要用神经网络拟合一个分布 $p_\theta(z|x)$ 和 $q_{\phi}(z|x)$ 接近。VAE假设每个 $x_i$ 服从标准正态分布。

损失函数：
x的似然函数可以写为：
$log(p_{\theta}(x_i))=D_{KL}(p_{\theta}(z|x_i)||q_{\phi}(z|x_i))+L(\theta,\phi,x_i)$
其中 $L(\theta,\phi,x_i)$ 为变分下界，因为KL散度的值是非负的，因此要最大化似然函数即最大化变分下界 $L(\theta,\phi,x_i)$ ，即最大化：

$L(\theta,\phi,x_i)=log(p_{\theta}(x_i|z))-D_{KL}(p_{\theta}(z|x_i)||q_{\phi}(z|x_i))$
则VAE的孙树函数分为两个部分
KL散度的计算公式为：
$D_{KL}(p(x)||q(x))=\sum_{i=1}^{n}p(x)log\frac{p(x)}{q(x)}$
VAE的KL损失计算当前z的分布与标准正态分布之间的KL散度，假设即 $p_{\theta}(z|x_i)$ ~ $N(\mu_i,\sigma_i)$
$D_{KL}(p_{\theta}(z|x_i)||q_{\phi}(z|x_i))=\mu_i^2+\sigma_i^2-log(\sigma_i^2)-1$
则VAE的损失函数如下：
$L(\theta,\phi,x)=\sum_{i=1}^{n}(-(\mu_i^2+\sigma_i^2-log(\sigma_i^2)-1)+mse(x_i,\hat{x_i}))$
VAE应用场景

VAE，GAN等统称为生成模型，生成模型的应用主要有以下几个方面：

图像生成，风格转换
NLP领域：文本生成
数据补全，自动补全因意外缺失的部分特征
学习数据的embedding特征

蓝色仙女

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
变分自编码器原理详解

变分自编码器基本思想：VAE在2013年提出，假设数据xix_ixi是由一个随机过程产生的，该随机过程分为两步：由先验分布Pθ∗(z)P_{\theta^*}(z)Pθ∗(z)产生隐变量ziz_izi，再由条件分布Pθ∗(x∣zi)P_{\theta^*}(x|z_i)Pθ∗(x∣zi)产生数据xix_ixi。Pθ(xi)P_{\theta}(x_i)Pθ(xi)可以表示为：Pθ(xi)=∫Pθ(xi∣z)pθ(z)dz P_{\theta}(x_i)=\int P_{\th
复制链接

扫一扫

专栏目录