小白谈VAE（Variational Autoencoder）（变分自动编码器）

最新推荐文章于 2023-06-25 18:42:02 发布

codedrinker

最新推荐文章于 2023-06-25 18:42:02 发布

阅读量1.3k

点赞数 3

分类专栏：算法文章标签：机器学习 VAE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunjinbat/article/details/107730598

版权

算法专栏收录该内容

6 篇文章 0 订阅

订阅专栏

前两天组会，论文提到了VAE，导师一直问我VAE，还问我能不能推出来当时哑口无言下面总结一下VAE 以及推倒。

上面的是模型。

这里先给出推导再解释参数。

从后面来看，P(x)是decoder 的可能性，当然要最大，这里的q是encoder一般选择正态分布。

继续化简

后面的是decoder的kl散度，>=0,所以它的lowerbound是前面这项。

为了最大化likelyhood，q(z|x)和p没有关系，因此最大化q(z|x)可以让lb增加并且减小了kl。

即

继续化简lb

得到loss function

合起来构造如下的损失函数：

上面的第一部分，可以看做是重建 loss，就是从 x∼z∼x的这样一个过程，可以表示成上面的熵的形式，也可以表示成最小二乘的形式，这个取决于x本身的分布。后面的 KL 可以看做是正则项，qθ(z∣x) 可以看成是根据x推导出来的z的一个后验分布，p(z)可以看成是z的一个先验分布，我们希望这两个的分布尽可能的拟合，所以这一点是VAE与GAN的最大不同之处，VAE对隐变量z是有一个假设的，而GAN里面并没有这种假设。一般来说，p(z)都假设是均值为0，方差为1的高斯分布 𝒩(0,1)如果没有 KL 项，那VAE就退化成一个普通的AE模型，无法做生成，VAE中的z隐变量是一个分布，或者说近似高斯的分布，通过对这个概率分布采样，然后再通过decoder网络，VAE可以生成不同的数据，这样VAE模型也可以被称为生成模型。

代码：https://github.com/bojone/vae/blob/master/vae_keras.py

关注

3
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
小白谈VAE（Variational Autoencoder）（变分自动编码器）

前两天组会，论文提到了VAE，导师一直问我VAE，还问我能不能推出来当时哑口无言下面总结一下VAE 以及推倒。上面的是模型。这里先给出推导再解释参数。从后面来看，P(x)是decoder 的可能性，当然要最大，这里的q是encoder一般选择正态分布。继续化简后面的是decoder的kl散度，>=0,所以它的lowerbound是前面这项。为了最大化likelyhood，q(z|x)和p没有关系，因此最大化q(z|x)可以让lb增加并且减小了kl。即
复制链接

扫一扫

专栏目录

codedrinker CSDN认证博客专家 CSDN认证企业博客

码龄7年

18: 原创

11万+: 周排名

115万+: 总排名

6万+: 访问

: 等级

678: 积分

21: 粉丝

93: 获赞

9: 评论

197: 收藏

私信

关注

热门文章

分类专栏

最新评论

静态重定位和动态重定位
超哥爱Java: 为什么动态时，内存空间可以移动呢，寄存器存了位置后不就相当于固定了吗？不管何时开始转换不都是同一个物理地址吗？
共用体的定义和使用
咱换个名字: 那为什么不是前面的值
静态重定位和动态重定位
Taste_chill: 逻辑地址转化为物理地址不就是装入过程吗
静态重定位和动态重定位
Wang Mr.: 静态是装入的过程中的。
共用体的定义和使用
itPengzi: 地址是同一个地址那么值就是同一个值

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。