浅谈对VAE的理解

最新推荐文章于 2024-11-04 18:23:08 发布

CrxzYia

最新推荐文章于 2024-11-04 18:23:08 发布

阅读量378

点赞数 7

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41276201/article/details/136360013

版权

文章讨论自编码器问题并提出改进，涉及隐含变量、条件设定及新Loss函数。

摘要由CSDN通过智能技术生成

1.AE（AutoEncoder）

上图是自编码器模型（AE）的示意图，想要让一个网络模型生成图片，很自然的可以想到上面的结构，我们利用一个编码器（Encoder）将训练图像压缩成一个向量，再利用解码器（Decoder）将这个压缩出来的向量还原成一幅图片，那么我们就能得到一个生成图片的模型了，显然这也是可以训练的，损失函数可以取原图与生成图之间的均方误差（MSE）

2. AE的问题

这里可以看到在AE中，把Decoder拿出来，我们就能通过构造隐含变量来让网络画图了。

这可行吗，当然不行，首先隐含变量是网络训练出来的，你根本不知道怎么来构建这个隐含变量，对于人来讲，这是个分布函数未知的随机变量。

哪我们不是还有Encoder吗，我们通过喂给他图片，让他来生成新图。这可行吗，似乎有点道理，但要注意到我们如果使用原始图片与生成图片之间的均方误差来训练模型，那么新的图片和原始图片相比几乎是没有差别的，那么我们训练这个模型有什么意义。

3.新的假设

根据以上问题，我们想要改进模型，那么我们就要给他加上条件。

首先，我们希望能够甩开Encoder，让隐含变量变得有规律。

其次，我们希望模型能够给我们带来惊喜，也就是不希望模型输入什么就得到什么。

那我们给新的模型加上一些人为的条件吧。

第一点，我们限制隐含变量服从一个标准正态分布 N(0,1)。

第二点，我们让Encoder不再输出一个固定的值，而是让它输出一个正态分布的参数，也就是 $N(\mu,\sigma ^{2})$ 中的μ和 $\sigma$ 。

好了，条件加完了，训练也进行不下去了，你会发现，编码器和隐含变量之间的联系断开了，编码器构建的是一个概率密度函数，而隐含编码需要的是一个值。

怎么办？采样！隐含变量从由Encoder给出的正态分布里采样得到，也就是重参数。代码怎么实现呢，这里有个技巧，那就是用Encoder给出的均值矩阵，加上用Encoder给出的方差矩阵生成的均值为0的新矩阵。

至此，我们的新模型就构建好了。

4.Loss

新模型的理论部分已经构建完毕，那么剩下的就是根据理论构建新Loss。

具体推导不是本文的重点。

最后的公式

$Loss = \frac{1}{2}\sum_{i=1}^{d}[(y_{i}-\bar{y_{i}})^{2}+(\sigma _i^2-1)-log(\sigma _i^2)+\mu ^2 ]$

公式十分简单，求原图片与生成图片的均方误差加上一个正则公式令生成模型的Encoder产生均值为0方差1的概率密度函数。

参考：

一文理解变分自编码器（VAE） - 知乎 (zhihu.com)

抛开数学，轻松学懂 VAE（附 PyTorch 实现） - 知乎 (zhihu.com)

(系列十二) 变分推断1-背景介绍_哔哩哔哩_bilibili

关注

7
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

CrxzYia CSDN认证博客专家 CSDN认证企业博客

码龄7年

46: 原创

20万+: 周排名

6万+: 总排名

3万+: 访问

: 等级

566: 积分

75: 粉丝

96: 获赞

14: 评论

145: 收藏

私信

关注

热门文章

分类专栏

前端 5篇
django 7篇
运维 2篇
laravel 1篇
bug 1篇
C# 3篇
算法 3篇

最新评论

Stable Diffusion爬坑
2401_83813649: 机场都能上。就是显示连不上网
Linux 挂载smb
CSDN-Ada助手: 推荐 CS入门技能树：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
Stable Diffusion爬坑
156的枝: 补充一下：关于第三点的报错，我当时开了魔法还是解决不了。这里提供两条我自己摸索出来的2个解决方法： 1降低分辨率，我在960分辨率的时候就报错，在400的时候就成功了 2换VAE，我换了VAE后就成功了，即使是960的分辨率也成功了
Stable Diffusion爬坑
CrxzYia: 就是要在开启魔法的条件下使用，找个你觉得合适的机场
Stable Diffusion爬坑
Iphone60PLus: 大佬，第3个插件搜索报错，开启代理使用，怎么开启？感谢

大家在看

最新文章

目录

目录

分类专栏

前端 5篇
django 7篇
运维 2篇
laravel 1篇
bug 1篇
C# 3篇
算法 3篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。