基于Fashion MNIST数据集上自编码器图像重建

最新推荐文章于 2024-06-14 10:30:15 发布

迪哥_AI_人工智能

最新推荐文章于 2024-06-14 10:30:15 发布

阅读量738

点赞数 6

文章标签：深度学习

本文链接：https://blog.csdn.net/do_it_123/article/details/136589695

版权

程序代码：

https://download.csdn.net/download/do_it_123/88935602

我们尝试着利用数据本身作为监督信号来指导网络的训练，即希望神经网络能够学习到映射：。我们把网络切分为两个部分，前面的子网络尝试学习映射关系：后面的子网络尝试学习映射关系: ,我们把成一个数据编码(Encode)的过程，把高维度的输入编码成低维度的隐变量(Latent Variable，或隐藏变量)，称为 Encoder 网络(编码器)；看成数据解码(Decode)的过程，把编码过后的输入z解码为高维度的x，称为 Decoder 网络(解码器)。

自编码器能够将输入变换到隐藏向量，并通过解码器重建(Reconstruct，或恢复)出。我们希望解码器的输出能够完美地或者近似恢复出原来的输入，即，那么，自编码器的优化目标可以写成:

Fashion MNIST数据集

Fashion MNIST 是一个定位在比 MNIST 图片识别问题稍复杂的数据集，它的设定与MNIST 几乎完全一样，包含了 10 类不同类型的衣服、鞋子、包等灰度图片，图片大小为28 × 28，共 70000 张图片，其中 60000 张用于训练集， 10000 张用于测试集，每行是一种类别图片。可以看到， Fashion MNIST 除了图片内容与 MNIST 不一样，其它设定都相同，大部分情况可以直接替换掉原来基于 MNIST 训练的算法代码，而不需要额外修改。由于 Fashion MNIST 图片识别相对于 MNIST 图片更难，因此可以用于测试稍复杂的算法性能。

编码器

我们利用编码器将输入图片降维到较低维度的隐藏向量：,并基于隐藏向量h利用解码器重建图片，自编码器模型如图所示，编码器由3层全连接层网络组成，输出节点数分别为 256、 128、 20，解码器同样由 3 层全连接网络组成，输出节点数分别为 128、 256、 784。