温故知新 | VAE 模型推导与总结

最新推荐文章于 2025-03-19 19:37:25 发布

机器学习与AI生成创作

最新推荐文章于 2025-03-19 19:37:25 发布

阅读量1.7k

点赞数

文章标签：人工智能机器学习深度学习计算机视觉 tensorflow

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5MTgzNzE0MA==&mid=2247495844&idx=2&sn=753ce3062ce727923413ccfe5b482a8e&chksm=fe2a521fc95ddb09d4f904878f2a4e6f42cf2ec5d5eed1c8145250c6b48197a25cd8da0a9ea4&scene=126&&sessionid=0

版权

来源：知乎—胖西西文仅分享，侵删

https://zhuanlan.zhihu.com/p/434394556

此总结首次完成于2021年4月25日，今日再次遇到vae模型推导问题，翻出一看，豁然开朗，故想分享于知乎社区，与大家共同分享，如有错误或不同见解请多多批评指正与交流。

摘要

VAE 模型 loss 的详细推导过程，变分自编码器的理解。

01

模型与说明

1.1 VAE模型基本网络结构

变分自编码器 (VAE) 由编码器和解码器两个部分组成。特征 x 输入编码器生成编码特征 z，z 输入解码器生成重构的 ; 通过生成角度来理解，该网络又可以分成推理网络和生成网络两部分。

图1:VAE模型, ( | )表示推断网络， ( | )表示的生成网络(公式格式存在问题)

1.2 与 的理解

是编码器/推理网络，该分布是真实的、复杂的，也是我们想去逼近的；而是我们自己定的，用来逼近或者约束的一个分布，是简单的，可主观决定的。

1.3 说明

变分自编码器所谓变分，指的是该模型存在泛函 ,解决该泛函问题需要采用变分法，也就是寻找一个函数/参数。

02

公式推导

首先需要明确VAE模型的目的就是为了使得似然函数最大。

2.1 使得似然函数 最大,为什么转化成使得 (变分下界)最大？

由贝叶斯定理：

公式1变形有:

公式2左右对取有：

变形有,其中为任一分布

公式3两端对求期望:

将公式4期望展开有:

由kl散度定义, 有:

令，并且由定义知道有:

当且仅当时, ,否则， ,将视为一个以为参数的泛函有：

改变并不能影响的大小，而且大于，那么欲似然更大，可从下手，当越大的情况下，似然就会更大

所以可以来最大化使得似然最大，使用神经网络的时候要注意，对进行优化，优化目标使得最小即可

2.2 对 再推导

因为对于，与独立，所以为了与encoder 接近，故将 ,修改为 ,有：

设重构的x服从于高斯分布( ),则有

设服从于多元高斯分布 ,另（认为设定的）服从于的分布，有(15)式：

二阶矩为，所以有：

根据重构项和KL散度项的约束，我们可以得出（19）式

!!!!注意，我们想让他越大越好，但在神经网络优化中，我们对先取负，转化成- 再优化，此时，- 越小越好

03

总结

根据以往经验，容易犯错误的地方有，使用神经网络时候，一定要对ELBO先取负再优化！

很久之前发布的文件与代码

https://gitee.com/sulei_ustb/vae-model

猜您喜欢：

戳我，查看GAN的系列专辑~！

一顿午饭外卖，成为CV视觉的前沿弄潮儿！

超110篇！CVPR 2021最全GAN论文汇总梳理！

超100篇！CVPR 2020最全GAN论文梳理汇总！

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。