【论文阅读】DerainCycleGAN

最新推荐文章于 2022-06-07 09:57:08 发布

GillianZhu

最新推荐文章于 2022-06-07 09:57:08 发布

阅读量2.5k

点赞数 1

分类专栏：深度学习图像处理文章标签：计算机视觉

本文链接：https://blog.csdn.net/weixin_37625243/article/details/103665671

版权

图像处理同时被 2 个专栏收录

15 篇文章 15 订阅

订阅专栏

深度学习

14 篇文章 1 订阅

订阅专栏

论文DerainCycleGAN: An Attention-guided Unsupervised Benchmark for Single Image Deraining and Rainmaking于2019.12.15收录于arxiv
论文链接

目前已有的去雨模型绝大多数是全监督的。全监督模型的良好性能来源于经过训练之后，训练集中雨水层的信息已经被模型学到了，因此使用成对数据时通常有很好的泛化性能。但是对于没有GT的真实雨图，大部分模型对不规则和不均匀的雨水没辙了

用半监督或者无监督做去雨的工作比全监督模型发展得慢得多，原因有两点：

真实雨图的雨水的形状和方向非常不规则，即使是合成的数据集，在没有严格的成对约束的情况下，也很难准确地得到雨图和背景图像之间的映射关系
对于现有的合成数据集，监督模型仍不能得到理想的修复结果

该论文在CycleGAN的基础上，提出无监督去雨模型DerainCycleGAN。主要贡献如下：

利用雨图和背景图之间的注意力机制引导的传输能力，以及具有两个约束分支的CycleGAN循环结构来去雨
提出无监督的注意力机制引导的雨水提取模型U-ARSE，对雨图和无雨图的空间域都使用注意力机制，一阶段一阶段地提取雨水。这样的操作也可用于解决两个空间之间的信息不对称
在无雨图到无雨图的循环一致性分支中得到的副产品，成对雨图数据集Rain200A，是第一个生成不规则形状和线条的去雨数据集，与真实数据集更加接近

模型

模型包含三个部分：

U-ARSE，从雨图中一阶段一阶段地提取雨水
两个生成器 $G_{N}$ ， $G_{R}$ ，分别生成无雨图和雨图
两个判别器 $D_{N}$ ， $D_{R}$ ，区分真图和G生成的图

两个分支：

雨-雨分支(rainy to rainy cycle-consistency branch)： $r->n_{r}->\widetilde{r}$ ，用雨图生成无雨图，再重构成雨图
无雨-无雨分支(rain-free to rain-free cycle-consistency branch)： $n->r_{n}->\widetilde{n}$ ，用无雨图生成雨图，再重构成无雨图

U-ARSE(Unsupervised Attention guided Rain Streak Extractor)

视觉注意力机制关注图像中的重要区域并捕捉这些区域的特征。U-ARSE同时对雨图和无雨图进行关注

U-ARSE包含6个阶段，每个阶段包含一个Hybrid Block单元（dual-path residual dense block，双路径残差密集块），一个LSTM单元和一个CNN，如下图所示
在这里插入图片描述
Hybrid Block有两条路径，可以重用前一层学到的通用特征，同时学习当前层的新特征。在训练时的每个步骤中，输入的图像将与前一个阶段中提取的雨水掩码(mask) 拼接，输入到Hybrid Block中。经过一个个阶段，提取到的mask与雨图中的雨水越来越接近。最后一个阶段提取到的mask与输入雨图一起作为生成器的输入

为了提取到准确的mask，定义了雨层注意力 $A t t (r)$ 和背景层注意力 $A t t (n)$ 上的先验作为约束，在多雨域和无雨域之间传输信息，解决两个域之间的不对称。

总的注意力损失如下：
在这里插入图片描述
$N$ 是高斯分布，N~(0,1)； $Z$ 是与mask相同大小、所有值为0的分布。用 $L_{attn_{r}}$ 计算 $A t t (r)$ 与N之间的均方误差；因为背景图中没有雨层，因此用 $L_{attn_{n}}$ 约束 $A t t (n)$ 尽可能与0接近

Generators & Discriminators

作者使用U-Net作为G。G的输入是原始雨图与上一个U-ARSE输出的最后一个attention map的拼接

$G_{N}$ 利用雨图 $r$ 和 $Att_{r}$ 生成无雨图 $n_{r}$ ， $G_{r}$ 利用无雨图 $n$ 和 $Att_{n}$ 生成雨图 $r_{n}$

U-ARSE从生成的 $n_{r}$ 和 $r_{n}$ 中提取到雨水信息 $Att_{n_{r}}$ 和 $Att_{r_{n}}$ ， $G_{r}$ 利用无雨图 $n_{r}$ 和 $Att_{n_{r}}$ 重构雨图 $\widetilde{r}$ ， $G_{n}$ 利用雨图 $r_{n}$ 和 $Att_{r_{n}}$ 重构无雨图 $\widetilde{n}$

$D_{r}$ 用于区分真实雨图 $r$ 和生成的雨图 $r_{n}$ ， $D_{n}$ 用于区分无雨图 $n$ 和生成的无雨图 $n_{r}$

D采用多尺度结构，每个尺度上的特征映射经过三个卷积层，然后输入sigmoid

目标函数

模型总目标函数如下：
在这里插入图片描述
所有 $\lambda$ 是trade-off参数， $L_{att}$ 在前文已经介绍过

$L_{adv}$

雨水域R上的对抗损失为：
在这里插入图片描述
$D_{R}$ 试图最大化损失函数，从而正确区分生成的雨图和真实雨图， $G_{R}$ 则需要最小化损失函数来生成能够以假乱真的雨图

无雨域N上的对抗损失为：
在这里插入图片描述

$L_{cc}$

在雨水域R和无雨域N上受约束的双分支的循环一致性损失函数 $L_{cc}$ (Constrained two-branch cycle-consistency loss)是原始雨图和生成雨图之间以及无雨图与生成的无雨图之间的L1损失的期望之和，可以限制生成样本的空间，保留图像的内容
在这里插入图片描述

$L_{p}$

CycleGAN生成的图像总是包含一些有瑕疵的区域。从预处理的网络中提取的特征包含丰富的语义信息，它们之间的距离可以作为感知相似性度量(perceptual similarity measure)，因此作者采用感知损失对生成的无雨图 $n_{r}$ 与原始雨图之间的差异：
在这里插入图片描述
$\phi_{l}$ 为预训练CNN的第l层特征提取器。作者使用在ImageNet上训练的VGG-16的 $conv_{2,3}$ 作为预训练模型

$L_{gmm}$

该损失描述用GMM(Gaussian Mixture Model)提取的雨水层，用负的对数相似性函数表示：
在这里插入图片描述
$S$ 是雨层，k是混合构件的数量， $\pi_{k}$ 是混合系数， $\mathscr{N}$ 表示高斯分布， $\mu_{k}$ , $\sum_{k}$ 分别是高斯分布的均值和方差

$S=r-n_{r}=r_{n}$ 是雨层