论文阅读:Image De-raining Using a Conditional Generative Adversarial Network

arXiv2017/2019 TCSVT: ID-CGAN

在这里插入图片描述
本篇文章是2017年提出的一种基于cGAN网络的一种新的去雨网络。主要是试图使用具有强大的生成建模能力的条件GAN网络加上一个强制约束,即去雨图像必须与相应的背景图像不可区分。同时GAN网络的对抗损失提供了额外的正则化。同时,还提出了一种新的细化损失函数,旨在减少GAN网络引入的伪影。生成器子网络使用了密集连接网络,判别器则是利用全局和局部信息来判断图像是真是假。

创新之处:
1、提出了一种基于cGAN网络的框架用于处理单幅图像去雨问题,同时不需要任何后续处理。
2、提出了一个密集连接的生成器子网络。
3、提出了一种多尺度鉴别器,利用局部信息和全局信息来判断去雨图像的真伪。

对前人工作改进:
在这里插入图片描述
现有的基于CNN 的方法只最小化L2误差,但由于问题的病态性质,这些方法需要额外的正则化。
来自CGANs的对抗损失被用作额外的正则化器,并且使用鉴别器对真实/虚假样本进行分类提供了额外的反馈。
ID-CGAN主要由两个子网络组成:密集连接的生成器和多尺度的判别器。
判别器主要通过多尺度池来捕获上下文信息。
同时在GAN网络训练时会引入伪影,这里引入一个改进的感知损失作为额外的损失函数来去除伪影。

网络结构:
在这里插入图片描述

其中,Dense Block 是密集连接网络,Transition为采样模块

具体工作:

1、GAN目标函数

在这里插入图片描述

其中,G为生成器,D是判别器

2、对称结构的生成器

在这里插入图片描述

在分离之后,新的域中的背景图像必须要转换回原来的域,这便要求了对称结构的使用。
密集块体使强梯度流动成为可能,并提高了参数效率。此外,我们还引入了跨越密集块的跳跃连接,以有效地利用来自不同级别的特性,并保证更好的收敛性。

第 j 个dense block 可以表示为:
在这里插入图片描述
其中,Dj,i 表示Dj dense block中的第i层的特征。
dense block的每一层都由BN + LReLU + 一个3x3的卷积

生成器的结构:
在这里插入图片描述
其中,CBLP是一组卷积层,后面依次是BN 、leaky ReLU 激活函数和池化模块,括号内的数字表示每个块的输出特征映射的通道数。

详细结构为:
在这里插入图片描述

3、多尺度判别器

在这里插入图片描述
前人工作发现,基于Patch的判别是有效的,但是仍然不能捕捉到足够的上下文全局信息。
因此,需要一个更强大的判别器捕捉局部和全局信息来判断图像是真是假。

图中,前部分的蓝色方块代表了卷积函数+BN+ PReLU 。中间为一个多尺度的池化模块,能在不同尺度下池化特征,最后是一个1x1的卷积层和一个sigmoid函数,用于生成标准化的概率分数[0,1]。

判别器的网络结构:
在这里插入图片描述

4、改进的感知损失函数

GANs训练中会引入伪影,于是引入感知损失来去除伪影。

新的损失函数为:
在这里插入图片描述
其中,每个像素的欧几里得损失为:
在这里插入图片描述

感知损失为:
在这里插入图片描述

对抗损失为:
在这里插入图片描述

训练:

使用PS自建合成数据集
700张训练图,100张测试 256x256

50张真实世界图片

评价指标:
PSNR、SSIM、UQI、VIF

参数设置:
batch-size = 1
itrations = 100k
学习率 = 0.002
在这里插入图片描述
做了消融实验和对比实验

分页符

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值