白话Variational Autoencoder（变分自编码器）

最新推荐文章于 2025-04-05 14:15:00 发布

一一爱吃大米

最新推荐文章于 2025-04-05 14:15:00 发布

阅读量6.2k

点赞数 8

分类专栏： DeepLearning 文章标签：深度学习自编码器机器学习 Variational Autoencoder

本文链接：https://blog.csdn.net/starwxd/article/details/79880942

版权

本文以简洁的语言介绍了Variational Autoencoder（VAE），它与传统自编码器的区别在于使用概率分布表示潜在特征。通过示例和图表解释了VAE的工作原理，包括使用概率分布近似条件概率p(z|x)的过程，以及在训练中采用的重参数化技巧，以允许反向传播。文章还包括了相关统计知识和参考资料。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文将简单介绍一下Variational Autoencoder。作者也在学习当中，如有不正确的地方，请大家指正，谢谢～

原始的autoencoder一般分为两个部分encoder part和decoder part。 encoder是将input转化为encoding vector，之后通过decoder network重新构造input。

图1 origanal autoencoder （from wikipedia）

VAE(变分自编码器) 与原始autoencoder不同的是，在encoder部分通过用概率分布来表示每一个潜在的特征。

举个例子：

图2 （from reference）

上面的图中，在经过encoder部分后，我们用一个具体的数来表述每一个潜在的特征，比如smile的值是0.99。但是有些时候，我们希望用一个区间来表示所有可能的潜在特征值，这就有了下图的表示，通过用一个概率分布函数来表示潜在的特征。当我们通过潜在状态decoding时，我们首先对每个概率分布生成随机样本，之后再重新构造input。