【论文阅读笔记】 A Style-Based Generator Architecture for Generative Adversarial Networks

weixin_50830241

已于 2023-06-19 15:51:04 修改

阅读量81

点赞数

文章标签：论文阅读笔记

于 2023-06-19 15:36:02 首次发布

本文链接：https://blog.csdn.net/weixin_50830241/article/details/131277728

版权

该文提出了Style-BasedGenerator架构用于卷积GAN，替换传统CNN中的pooling操作，使用stridedconvolutions。在D和G中应用不同的激活函数，如LeakyReLU和ReLU，并通过归一化改善训练。模型训练不依赖数据增强，仅调整像素范围。文章还探讨了模型的可视化方法，包括在latentspace中的行走和网络滤波器的可视化。

摘要由CSDN通过智能技术生成

题目	作者	会议	subject
A Style-Based Generator Architecture for Generative Adversarial Networks	Tero Karras, Samuli Laine, Timo Aila	CVPR 2019	ML;NE

一、摘要

提出并评估了卷积GAN的结构
将训练好的鉴别器应用于图片分类任务
可视化filters，探索内部的每一层到底学到了什么表达

二、修改CNN+GAN架构

对现有的CNN架构做了修改

在生成模型、判别模型中使用 strided convolutions 替代 pooling
- D：容许网络学习空间下采样
- G：容许网络学习空间上采样
不适用全连接层
Batch Normalization
- 将每个单元的输入归一化为零均值和单位方差
- 解决由于初始化不良而导致的训练问题
- 有助于深度模型中的梯度流动
激活函数
- 生成模型：输出层用Tanh函数，其它层用ReLU激活函数。
- 判别模型：所有层使用LeakyReLU

三、网络结构

在这里插入图片描述

四、模型训练

对原始数据不进行数据增强，只是将像素值变换到[-1, 1]之间
Adam优化器
初始学习率0.0002
beta_1参数0.5
Leaky Relu中参数设置为0.2

五、可视化

1. Walking In The Latent Space

对于输入X1、X2得到的结果Y1、Y2，查看X1、X2的差值生成的图片
若“平滑过渡”证明模型的确有学习到特征

2.D的可视化

被“激活”的部分

3.G的可视化

weixin_50830241

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【论文阅读笔记】 A Style-Based Generator Architecture for Generative Adversarial Networks

提出并评估了卷积GAN的结构将训练好的鉴别器应用于图片分类任务可视化filters，探索内部的每一层到底学到了什么表达。
复制链接

扫一扫