ConSinGAN 笔记

ConSinGAN是一种改进的SinGAN方法,通过多阶段训练和特定任务优化生成高质图像。它强调了不同阶段的学习率调整和图像采样率变化,以保留图像的结构和细节。实验表明,ConSinGAN在保持图像全局结构和物体连接性方面优于SinGAN,适用于图像多样性生成、编辑和漫画创作。
摘要由CSDN通过智能技术生成

ConSinGAN

使用一张图片训练一个对抗生成网络。

相关研究

SinGAN

原理:从一个分辨率很低的图像开始,进行多阶段的训练,每进入一个新的阶段,就加入更多的计算层。在每个训练阶段,都将先前阶段的计算层冻结,只在新加入的层上训练。

原因:如果只在新加入的层上进行计算,相当于将输入不断的作为input输入到新加入的层中,会影响模型的训练过程。如果每次都在所有层上计算,并对所有层的权重进行优化,则很容易造成模型的过拟合。

研究内容

低维的特征对于保持图像的结构贡献较大,高维特征对于保持图像的纹理特征和颜色非常重要。并且,对于高分辨率的图像只需要较少的训练次数,所以本文对于低分辨率图像赋予了更高的权重,对于高分辨率的图像,赋予了更少的训练阶段。

对比传统的sinGAN主要贡献有以下三点:

  • 在每个阶段并行训练,并且使用不同的学习率。
  • 对于每个中间阶段,不产生图像而是将特征继续前向传播。
  • 引入了微调,可以针对预训练的模型进行优化。

网络结构如下:


原理:

  1. 在第一阶段(stage 0),只有三个卷积层的模型从一个随机噪声产生一个低分辨率的粗糙图像。
  2. 在训练了n轮后,向网络中加入三个卷积层,生成一个分辨率较高的图像,这一步的输入是使用前一步的输出进行计算的(stage 1)。
  3. 继续2步骤,直到产生本文期望的图像分辨率;并继续添加随机噪声,同时训练网络的最后三个stage(stage N)。

在训练中,判别器使用patch方式进行惩罚,随着stage的增加,patch的感受野会变得越来越小,判别器的关注点也会从低维的全局图像结构,逐渐往高维的色彩和纹理特征转换。与sinGAN相反,本文在更高的stage中不对判别器进行增大而是保持其规模不变。

本文方法

多阶段训练

整体的损失函数为:
在这里插入图片描述
其中, L r e c

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值