DCGAN
研究内容
- 提出了对网络进行限制的手段,使GAN的训练过程更加稳定
- 使用GAN的判别器作为图像分类任务的分类器
- 对卷积核进行可视化,验证了特定的卷积核用来产生特定的图像
本文方法
-
生成网络中,使用卷积层替换所有池化层,使网络学习它本身的下采样方法。
-
删除全连接层,虽然全连接层能够提高稳定性,但是会影响收敛速度。
-
添加BN层,使得梯度能够向深层传递,防止模型坍塌。但每一层都使用BN会导致模型出现震荡,所以本文在生成器输出层和判别器输入层不加BN。
-
使用ReLU对生成器除输出层以外的所有层进行激活,输出层使用tanh激活。
-
使用LeakyReLu对判别器所有层进行激活。
实验
可视化
-
导向反传播,作者使用导向反传播的方法对生成网络的生成过程进行可视化。
-
操作GAN生成的特征
作者在实验中尝试用LR等回归模型定位窗户所在的位置,并且将其从生成模型中移除;结果显示,本来窗户所在的位置被图像中的其他物体替代了。
-
人脸特征空间的向量计算
总结
这篇文章属于利用生成模型和判别模型对图像进行特征提取,说明了GAN的两个网络作为一种非监督学习方法,对特征提取有较好的反馈,并且作者提出,可以将本文的方法进行拓展,衍生到视频和音频预测的问题中。