题目 | 作者 | 会议 | subject |
---|---|---|---|
A Style-Based Generator Architecture for Generative Adversarial Networks | Tero Karras, Samuli Laine, Timo Aila | CVPR 2019 | ML;NE |
一、摘要
- 提出并评估了卷积GAN的结构
- 将训练好的鉴别器应用于图片分类任务
- 可视化filters,探索内部的每一层到底学到了什么表达
二、修改CNN+GAN架构
对现有的CNN架构做了修改
- 在生成模型、判别模型中使用 strided convolutions 替代 pooling
- D:容许网络学习空间下采样
- G:容许网络学习空间上采样
- 不适用全连接层
- Batch Normalization
- 将每个单元的输入归一化为零均值和单位方差
- 解决由于初始化不良而导致的训练问题
- 有助于深度模型中的梯度流动
- 激活函数
- 生成模型:输出层用Tanh函数,其它层用ReLU激活函数。
- 判别模型:所有层使用LeakyReLU
三、网络结构
四、模型训练
- 对原始数据不进行数据增强,只是将像素值变换到[-1, 1]之间
- Adam优化器
- 初始学习率0.0002
- beta_1参数0.5
- Leaky Relu中参数设置为0.2
五、可视化
1. Walking In The Latent Space
- 对于输入X1、X2得到的结果Y1、Y2,查看X1、X2的差值生成的图片
- 若“平滑过渡”证明模型的确有学习到特征
2.D的可视化
- 被“激活”的部分