我自己的配置采用cpu完成训练。文中也可以设置GPU,python版本3.9,在自己用conda创建的虚拟环境中完成。
1、任务解读
原任务是生成嘴部特征图片数据,我采用自建的眼底数据,目标是生成具有特征的眼底图片
1.1 DCGAN工程技巧
- 在网络深层去除全连接层
- 使用带步长的卷积代替池化
- 在生成器的输出层使用Tanh激活,其它层使用ReLu。Tanh的范围在[-1,1]可以保证图像的范围
- 在判别器的输出层采用sigmoid激活(因为要的是0-1之间的概率),其它层用了LReLu激活。
- 除了生成器的输出层和判别器的输入层,其他卷积层上都用了Batch Normalization,可以稳定学习,有助于处理初始化不良导致的训练不收敛的问题。
1.2 模型定义
nc:图片的通道数(nc=3通道)
nz:噪声的维度(nz=100)
ngf:生成器特征图通道数量单位(ngf=64)
nc:图片的通道数(nc=3通道)
ndf:判别器特征图通道数量单位(ngf=64)
二、模型搭建
三、模型训练。四、模型测试见代码
视频1-DCGAN图像生成项目解读_哔哩哔哩_bilibili
csdn:(53条消息) 从零使用GAN(生成对抗网络)进行图像生成_gan图像生成_hyk今天写算法了吗的博客-CSDN博客