MNIST数据集:数据集下载
下载好数据集新建MNIST文件夹,再在里边建一个raw文件夹,数据集解压后放到raw文件夹中(数据集后缀为.gz,不需要再解压了)
简介:
变分自编码器(Variational Autoencoder,VAE)是生成式模型(Ggenerative Model)的一种,另一种常见的生成式模型是生成式对抗网络(Generative Adversial Network,GAN)
原理:
以MNIST为例,再看过几千张手写数字图片之后,能够进行模仿,并生成一些类似的图片,这些图片在原始数据中并不存在,有一些变化但是看起来很相似,也就是说,需要学会原始数据X的分布,这样根据数据的分布就能轻松地产生新样本。
P(x)------数据分布
但是数据分布地估计不是件容易地事,尤其是当数据量不足的时候,因此可以使用一个隐变量z,由z经过一个复杂的映射得到x,并且假设z服从高斯分布(正态分布)。
x=f(z;θ)
因此只需要学习隐变量所服从高斯分布的参数(高斯分布的均值和方差),以及映射函数,即可得到原始数据的分布。为了学习隐变量所服从高斯分布的参数,需要得到z足够多的样本,然而z的样本并不能直接获得,因此还需要一个映射函数(条件概率分布),从已有的x样本中得到对应的z样本。
z=Q(x)