pggan学习笔记

(边学边更新)

1 、pggan的基本介绍

如果直接生成大分辨率的图片,建立从latent code 到 1024x1024 pixels样本的映射网络G,肯定是很难工作的,因为,在生成的过程中, 判别器D很容易就可以识别出G生成的“假图像”,G难以训练 。因此,提出PGGAN(progressive gan)来进行逐层训练。

训练开始于有着一个4*4像素的低空间分辨率的生成器和判别器。随着训练的改善,逐渐的向生成器和判别器网络中添加层,因此增加生成图片的空间分辨率。所有现存的层通过进程保持可训练性。这里N×N是指卷积层在N×N的空间分辨率上进行操作。这个方法使得在高分辨率上稳定合成并且加快了训练速度。右图展示了六张通过使用在1024 × 1024空间分辨率上渐进增长的方法生成的样例图片。 (如fig1)

 fig1

当把生成器和判别器的分辨率加倍时,会平滑的增强新的层。这个样例解释了如何从16 × 16像素的图片转换到32 × 32像素的图片。(如fig2)

  • 2x是指用最近邻卷积上采样将图片的长宽翻倍,而0.5x表示用平均池化的方法将图像长宽缩小一倍

  • 关于toRGB &&from RGB : 因为此时生成网络最后的输出通道数不一定为3,所以需要toRGB将其转换为RGB三通道,具体操作时用1x1的卷积核进行卷积操作,fromRGB恰好相反

  • 关于权重α:我们把在更高分辨率上操作的层视为一个残缺块, α表示新加入层的权重,当α=0时,相当于未加入这一层,当α=1时,就变成了一般的网络结构。α在训练过程中逐渐由小增大直至到1

    fig2

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值