【论文阅读笔记】 A Style-Based Generator Architecture for Generative Adversarial Networks

该文提出了Style-BasedGenerator架构用于卷积GAN,替换传统CNN中的pooling操作,使用stridedconvolutions。在D和G中应用不同的激活函数,如LeakyReLU和ReLU,并通过归一化改善训练。模型训练不依赖数据增强,仅调整像素范围。文章还探讨了模型的可视化方法,包括在latentspace中的行走和网络滤波器的可视化。
摘要由CSDN通过智能技术生成
题目作者会议subject
A Style-Based Generator Architecture for Generative Adversarial NetworksTero Karras, Samuli Laine, Timo AilaCVPR 2019ML;NE

一、摘要

  • 提出并评估了卷积GAN的结构
  • 将训练好的鉴别器应用于图片分类任务
  • 可视化filters,探索内部的每一层到底学到了什么表达

二、修改CNN+GAN架构

对现有的CNN架构做了修改

  • 在生成模型、判别模型中使用 strided convolutions 替代 pooling
    • D:容许网络学习空间下采样
    • G:容许网络学习空间上采样
  • 不适用全连接层
  • Batch Normalization
    • 将每个单元的输入归一化为零均值和单位方差
    • 解决由于初始化不良而导致的训练问题
    • 有助于深度模型中的梯度流动
  • 激活函数
    • 生成模型:输出层用Tanh函数,其它层用ReLU激活函数。
    • 判别模型:所有层使用LeakyReLU

三、网络结构

在这里插入图片描述

四、模型训练

  • 对原始数据不进行数据增强,只是将像素值变换到[-1, 1]之间
  • Adam优化器
  • 初始学习率0.0002
  • beta_1参数0.5
  • Leaky Relu中参数设置为0.2

五、可视化

1. Walking In The Latent Space

  • 对于输入X1、X2得到的结果Y1、Y2,查看X1、X2的差值生成的图片
  • 若“平滑过渡”证明模型的确有学习到特征

2.D的可视化

  • 被“激活”的部分

3.G的可视化

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值