基于DCGAN的手写数字生成

wangzaojun

已于 2024-05-05 09:16:32 修改

阅读量1.1k

点赞数 14

文章标签：深度学习神经网络人工智能

于 2023-12-08 15:10:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_66504204/article/details/134879139

版权

1. 简介

DCGAN是将CNN与GAN的一种结合，这是第一次在GAN中使用卷积神经网络并取得了非常好的结果，弥合CNN在监督学习和无监督学习之间的差距，其将卷积网络引入到生成式模型当中来做无监督的训练，利用卷积网络强大的特征提取能力来提高生成网络的学习效果。

2. 代码概述

这段代码主要包括以下几个关键部分：

2.1 Generator（生成器）

生成器负责生成图像，它包括反卷积层和批量归一化层。生成器的目标是生成逼真的手写数字图像。

生成器的架构如下：

- 输入层：100维的随机噪声向量

- 反卷积层1：将输入向量转换为256x7x7的特征图

- 反卷积层2：将通道数减半，输出128x14x14的特征图

- 反卷积层3：将通道数再次减半，输出64x28x28的特征图

- 反卷积层4：将通道数再次减半，输出1x28x28的特征图

- 输出层：通过Tanh激活函数将特征图映射到[-1, 1]的范围内输入经过每个反卷积层后，会进行 ReLU 激活函数，最后一层使用 tanh 激活函数将输出限制在 (-1, 1) 的范围内。整体结构的目标是将输入的随机噪声逐渐转化为逼真的图像。

2.2 Discriminator（鉴别器）

鉴别器负责对图像进行分类，判断图像是真实的还是生成的。它包括卷积层和批量归一化层。

鉴别器的架构如下：

- 输入层：1x28x28的图像

- 卷积层1：输出128x14x14的特征图，使用Leaky ReLU激活函数

- 卷积层2：输出256x7x7的特征图，使用Leaky ReLU激活函数

- 卷积层3：输出512x3x3的特征图，使用Leaky ReLU激活函数

- 卷积层4：输出1024x1x1的特征图，使用Leaky ReLU激活函数

- 输出层：单一节点，通过Sigmoid激活函数输出鉴别结果（真实或伪造）

每个卷积层后都使用了带有 Leaky ReLU 激活函数的层，该函数有助于鉴别器学习特征。最后一层使用 sigmoid 激活函数，将输出映射到0到1的范围，用于二元分类（真实或假）。

2.3 训练过程

训练过程中，生成器和鉴别器交替训练。生成器试图生成逼真的图像，以愚弄鉴别器，而鉴别器试图准确分类真实图像和生成图像。

3. 实验步骤

3.1 数据预处理

在这一步中，我们加载MNIST数据集并进行以下预处理步骤：

图像尺寸调整到64x64像素
归一化：将像素值从[0, 255]缩放到[-1, 1]范围

3.2 网络构建

创建生成器（Generator）和鉴别器（Discriminator）网络结构。
初始化网络权重和偏差。

3.3 损失函数和优化器

使用二元交叉熵（BCE）损失函数来评估生成器和鉴别器的性能。
使用Adam优化器来更新生成器和鉴别器的权重。设置β1为0.5和β2为0.999。

3.4 训练DCGAN

定义训练循环，交替训练生成器和鉴别器。
训练迭代数：20个epoch
每个epoch中的步骤：
- 训练鉴别器：通过向鉴别器提供真实图像和生成图像，计算并更新鉴别器的损失。
- 训练生成器：通过向生成器提供噪声，生成图像并计算并更新生成器的损失。

4. 结果分析

4.1 损失曲线

在训练过程中，损失曲线如下图所示。横轴表示训练迭代次数，纵轴表示损失值。

GAN损失曲线

我们可以看到，生成器（绿色曲线）的损失逐渐下降，而鉴别器（蓝色曲线）的损失也在下降，这表明GAN在训练过程中逐渐收敛。

4.2 生成图像展示

以下是训练过程中生成的手写数字图像示例：

使用固定噪声生成（fixed_z_）

DCGAN

MNIST 与生成的图像

MNIST

GAN after 100 epochs

DCGAN after 20 epochs

4.3 性能分析

生成的图像在视觉上是逼真的，它们展示了手写数字的特征。这说明DCGAN成功地生成了类似于MNIST数据集中的手写数字的图像。

5. 总结

本实验中，我们成功地使用DCGAN生成了手写数字图像。实验结果表明，GAN在生成逼真图像方面具有潜力，尽管仍有改进的空间。

关注

14
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

wangzaojun CSDN认证博客专家 CSDN认证企业博客

码龄3年

甘肃政法大学

22: 原创

17万+: 周排名

4万+: 总排名

1万+: 访问

: 等级

507: 积分

561: 粉丝

282: 获赞

6: 评论

277: 收藏

私信

关注

热门文章

最新评论

大模型的智能化提升：从理解力、泛化能力到适应性
CSDN-Ada助手: 恭喜用户发布了第14篇博客！标题中提到了大模型的智能化提升，内容涉及理解力、泛化能力和适应性，非常值得学习和思考。希望用户能够继续保持创作的热情和耐心，深入探讨这些话题，并可以结合实际案例或者研究成果进行更深入的分析和讨论。期待用户的下一篇博客！
融合区块链与人工智能技术的数据隐私保护研究
普通网友: 每当我阅读你的编程博客文章时，我总能感受到你的专业水平和耐心解答的精神。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
NLP实践—第1关：词性标注
CSDN-Ada助手: 恭喜您发布了第9篇博客！词性标注是NLP中非常重要的一环，您的实践经验和分享无疑会对初学者有很大的帮助。希望您能继续分享更多关于NLP实践的经验和技巧，也可以考虑结合实际案例分析或者对比不同词性标注工具的使用效果等方面展开创作，期待您的下一篇作品！
NLP实践—基于PCFG实现CYK算法
CSDN-Ada助手: 恭喜你写了这么一篇深入的博客！对于NLP实践和PCFG实现CYK算法的讨论，我感到非常兴奋。希望你能继续分享你的研究成果，或许可以考虑结合实际案例进行更深入的分析，或者尝试探讨一些新颖的NLP技术。期待你未来更多的精彩文章！
基于LSTM的FashionMNIST分类
CSDN-Ada助手: 恭喜作者在博客中分享了基于LSTM的FashionMNIST分类的内容，这是一个很有趣且有挑战性的主题。希望作者能够继续保持创作的热情，不断探索深度学习领域的更多可能性。下一步建议可以尝试探讨一些实际应用场景中的深度学习技术，或者深入分析一些算法的优缺点，这样可以让读者更加全面地了解深度学习的应用和发展方向。期待作者未来更多精彩的作品！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wangzaojun 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。