论文阅读:Dehaze-GLCGAN: Unpaired Single Image Dehazing Via Adversarial Training

论文题目及作者

1. 摘要

    本文提出了一个名为Global-Local Cycle-consistent Generative Adversarial Network(Dehaze-GLCGAN)的去雾网络。该网络包含两个生成器和四个判别器。两个生成器分别用于从雾图产生去雾图和从无雾图产生雾图。四个判别器,两个为全局判别器,两个为局部判别器。全局判别器用于判别整张图像,局部判别器用于判别局部图像块。

2. 网络结构

2.1 整体结构

    网络的整体结构如图1:
网络整体结构

图1 网络整体结构

    领域 A A A为雾图,领域 B B B为无雾图。 G A G_A GA用于将 A A A的图像转换成 B B B的图像, G B G_B GB用于将 B B B的图像转换成 A A A的图像。 D A g l o b a l D_A^{global} DAglobal用于判断一张雾图是从A中取样的还是 G B G_B GB生成的, D B g l o b a l D_B^{global} DBglobal用于判断一张无雾图是从B中取样的还是 G A G_A GA生成的。 D A l o c a l D_A^{local} DAlocal用于判断一个局部雾图块是从A中取样裁剪的还是 G B G_B GB生成的雾图裁剪的, D B l o c a l D_B^{local} DBlocal用于判断一个局部无雾图块是从B中取样裁剪的还是 G A G_A GA生成的无雾图裁剪的。
    局部块是从图像中随机裁剪的5个大小为64×64的块。通过消融实验,证实了添加 D A l o c a l D_A^{local} DAlocal D B l o c a l D_B^{local} DBlocal的效果更好。

2.1 网络详情

    两个生成器使用相同的网络框架,同样所有的生成器也是使用相同的网络框架,只不过输入的图像尺寸不同。

1) 生成器

     G A G_A GA框架如图2所示。
生成器结构

图2 生成器结构

     G A G_A GA有三个模块,分别是编码器,特征转换器和解码器。编码器中首先是一个卷积层外带实例标准化和ReLU激活函数,接着是两个下采样块。特征转换器包含了六个残差块,残差块如图2右下角所示。编码器首先时两个用反卷积层的上采样块,和编码器是镜像结构。
     G B G_B GB G A G_A GA有着相同的框架。

2) 判别器

    图2右边部分展示了 D B g l o b a l D_B^{global} DBglobal D B l o c a l D_B^{local} DBlocal D A g l o b a l D_A^{global} DAglobal D B g l o b a l D_B^{global} DBglobal有着相同的框架, D A l o c a l D_A^{local} DAlocal D B l o c a l D_B^{local} DBlocal有相同的框架。全局判别器在雾不均匀的图像上会判别失败,所以才引入了局部判别器用于判别从图像随即裁剪的局部图像块。

3. 损失函数

3.1 对抗损失

    全局判别器损失:
L D G l o b a l = E x r ∼ P r e a l [ ( D ( x r ) − 1 ) 2 ] + E x f ∼ P f a k e [ ( D ( x f ) − 0 ] ) 2 ] (1) \left.L_{D}^{G l o b a l}=E_{x_{r} \sim P_{r e a l}}\left[\left(D\left(x_{r}\right)-1\right)^{2}\right]+E_{x_{f} \sim P_{f a k e}}\left[\left(D\left(x_{f}\right)-0\right]\right)^{2}\right] \tag{1} LDGlobal=ExrPreal[(D(xr)1)2]+ExfPfake[(D(xf)0])2](1)

    全局生成器损失:
L G G l o b a l = E x r ∼ P f a k e [ ( D ( x f ) − 1 ) 2 ] (2) L_{G}^{G l o b a l}=E_{x_{r} \sim P_{f a k e}}\left[\left(D\left(x_{f}\right)-1\right)^{2}\right] \tag{2} LGGlobal=ExrPfake[(D(xf)1)2](2)

    局部判别器损失:
L D L o c a l = E x r ∼ P r e a l − p a t c h e s [ ( D ( x r ) − 1 ) 2 ] + E x f ∼ P f a k e − p a t c h e s [ ( D ( x f ) − 0 ) 2 ] (3) L_{D}^{L o c a l}=E_{x_{r} \sim P_{r e a l-p a t c h e s}}\left[\left(D\left(x_{r}\right)-1\right)^{2}\right]+E_{x_{f} \sim P_{f a k e-p a t c h e s}}\left[\left(D\left(x_{f}\right)-0\right)^{2}\right] \tag{3} LDLocal=ExrPrealpatches[(D(xr)1)2]+ExfPfakepatches[(D(xf)0)2](3)

    局部生成器损失:
L G L o c a l = E x f ∼ P f a k e − p a t c h e s [ ( D ( x f ) − 1 ) 2 ] (4) L_{G}^{L o c a l}=E_{x_{f} \sim P_{f a k e-p a t c h e s}}\left[\left(D\left(x_{f}\right)-1\right)^{2}\right] \tag{4} LGLocal=ExfPfakepatches[(D(xf)1)2](4)

3.2 循环一致性损失

    循环一致性损失如下。具体看这篇博客
L c y c l e ( G A , G B ) =   E x ∼ p data ( x ) [ ∥ ( G B ( G A ( x ) ) − x ) ∥ ] 1 +   E y ∼ p data ( y ) [ ∥ ( G A ( G B ( y ) ) − y ) ∥ ] 1 (5) \begin{aligned} L_{c y c l e}\left(G_{A}, G_{B}\right)=& \ E_{x \sim p_{\text {data}(x)}}\left[\left\|\left(G_{B}\left(G_{A}(x)\right)-x\right)\right\|\right]_{1} \\ +&\ E_{y \sim p_{\text {data}(y)}}\left[\left\|\left(G_{A}\left(G_{B}(y)\right)-y\right)\right\|\right]_{1} \end{aligned} \tag{5} Lcycle(GA,GB)=+ Expdata(x)[(GB(GA(x))x)]1 Eypdata(y)[(GA(GB(y))y)]1(5)

3.3 颜色损失

    颜色损失如下:
L c o l o r ( A , B ) = ∥ ( A b l u r r e d − B b l u r r e d ) ∥ 2 2 (6) L_{ {color}}(A, B)=\left\|\left(A_{ {blurred}}-B_{{blurred}}\right)\right\|_{2}^{2} \tag{6} Lcolor(A,B)=(AblurredBblurred)22(6)

    其中 A A A B B B分别为增强图像和无雾图像, A b l u r r e d A_{blurred} Ablurred B b l u r r e d B_{blurred} Bblurred分别为 A A A B B B经过高斯模糊处理后的图像。

    文中说该损失用于测量增强图像(Enhance image)和无雾图像(haze-free image)之间的差距,但是没有说该增强图像是什么。 颜色损失在《Dslr-quality photos on mobile devices with deep convolutional networks》这篇文章中提出,文章是关于图像复原的,所以有增强图像。但是本文中,我不太清楚这个增强图像具体指什么。两种猜测:
    第一,增强图像是指去雾图像,但是本文是无配对图像对的数据集,所以并不存在雾图的Ground-Truth。
    第二,去除一张无雾图像 y y y,增强图像指的是 G A ( G B ( y ) ) G_A(G_B(y)) GA(GB(y))。这和循环一致性损失相似。
    但是感觉都不对,以后如果看懂了会回来补充的。

3.4 循环感知损失

    循环感知损失如下。具体看这篇博客
L o s s C P ( I h ) = 1 W i , j H i , j ∑ x = 1 W i , j ∑ y = 1 H i , j ( σ i , j ( I h ) − σ i , j ( G ( I h ) ) ) 2 (7) {Loss}_{C P}\left(I_{h}\right)=\frac{1}{W_{i, j} H_{i, j}} \sum_{x=1}^{W_{i, j}} \sum_{y=1}^{H_{i, j}}\left(\sigma_{i, j}\left(I_{h}\right)-\sigma_{i, j}\left(G\left(I_{h}\right)\right)\right)^{2} \tag{7} LossCP(Ih)=Wi,jHi,j1x=1Wi,jy=1Hi,j(σi,j(Ih)σi,j(G(Ih)))2(7)

    本文中使用的是在ImageNet Dataset上预训练好的VGG-16中第2和第5池化层提取出的特征图。

3.5 总损失

    Dehaze-GLCGAN的总损失函数定义如下:
L o s s t o t a l =   L global G A N + L local G A N + L global Cycle + L local Cycle +   L global C P + L local C P + L global color + L local color (8) \begin{aligned} {Losstotal}=& \ L_{\text {global}}^{G A N}+L_{\text {local}}^{G A N}+L_{\text {global}}^{\text {Cycle}}+L_{\text {local}}^{\text {Cycle}} \\ +& \ L_{\text {global}}^{C P}+L_{\text {local}}^{C P}+L_{\text {global}}^{\text {color}}+L_{\text {local}}^{\text {color}} \end{aligned} \tag{8} Losstotal=+ LglobalGAN+LlocalGAN+LglobalCycle+LlocalCycle LglobalCP+LlocalCP+Lglobalcolor+Llocalcolor(8)

4. 读后感

    除了生成器的框架,本文其余部分基本来自其他论文。判别器框架和局部判别器思想来自《Enlightengan: Deep light enhancement without paired supervision》,对抗损失来自《Least squares generative adversarial networks》,循环一致性损失和循环感知损失来自《Cycle-Dehaze: Enhanced CycleGAN for Single Image Dehazing》,颜色损失来自《Dslr-quality photos on mobile devices with deep convolutional networks》。

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
Cycle-Dehaze是一种增强版的CycleGAN架构,用于单图像去雾。与CycleGAN相比,Cycle-Dehaze引入了一个额外的损失函数,即循环感知一致性损失。其目标是通过优化CycleGAN架构并增加循环感知一致性损失来实现去雾效果。在测试时,Cycle-Dehaze使用生成器G*来获得无雾的图像。 Cycle-Dehaze的网络结构借鉴了EnhanceNet的感知损失思想,将原始图像与重建的循环图像在特征空间进行比较,而不是在像素空间进行比较。循环一致性损失确保高峰值信噪比(PSNR),而感知损失在特征空间保持图像的清晰度。此外,Cycle-Dehaze还使用传统的拉普拉斯金字塔在主要去雾过程之后提供更好的上采样结果。 文献提出了Cycle-Dehaze的增强版CycleGAN,该论文的标题是《Cycle-Dehaze: Enhanced CycleGAN for Single Image Dehazing》,作者是Deniz Engin、Anil Gen&ccedil;和Hazim Kemal Ekenel。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Cycle-Dehaze: Enhanced CycleGAN for Single Image Dehazing循环去雾:增强循环gan单幅图像去雾(重要基础...](https://blog.csdn.net/m0_75262530/article/details/131486884)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Cycle-Dehaze:用于单图像去雾的增强型 CycleGAN(2018_CVPR)](https://blog.csdn.net/weixin_44021553/article/details/124333731)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [细节增强的matlab代码-Cycle-Dehaze:循环除雾](https://download.csdn.net/download/weixin_38617335/19109106)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值