AAAI 2020 SR+ITM论文：JSI-GAN

最新推荐文章于 2020-09-18 23:38:25 发布

Najlepszy

最新推荐文章于 2020-09-18 23:38:25 发布

阅读量1k

点赞数

分类专栏： LDR2HDR

本文链接：https://blog.csdn.net/Najlepszy/article/details/103991370

版权

LDR2HDR 专栏收录该内容

20 篇文章 14 订阅

订阅专栏

JSI-GAN: GAN-Based Joint Super-Resolution and Inverse Tone-Mapping with Pixel-Wise Task-Specific Filters for UHD HDR Video

摘要

使用分治策略来处理SR-iTM问题；将其分成三个任务相关的子网络：图像重建子网络（image reconstruction subnet），细节恢复子网络 (detail restoration subnet)，局部对比度增强子网络(local contrast enhancement subnet)，从而学习到一组像素级的逐像素的1维可分离卷积用于复原细节，像素级的2维局部卷积核来用于对比度增强。此外，作者提出一种可增强细节信息的GAN loss，可同时增强细节恢复和对比度复原。
代码链接： https://github.com/JihyongOh/JSI-GAN

Introduction

在这里插入图片描述
一方面，作者认为SR-ITM这个问题需要同时考虑两个问题：如何在上采样的结果中恢复细节；由于比特位数增加如何增强局部的对比度信息（enhance local contrast)
GAN网络可用于生成图片，但作者认为GAN网络会导致主观的图像质量提高的同时降低客观的评价指标（PSNR,SSIM）,直接使用传统的GAN网络的结构会导致缺少相应的细节和局部的对比度，因此本文中使用了新的detail loss，使得生成的图片与GT的细节更相符合，并且使用一种feature-matching loss，用来减轻在训练过程中客观评价的drop。
Contributions：
1.提出JSI-GAN，使用新的detail loss和feature-matching loss用于保证细节的复原和训练的稳定性。
2.将网络的生成器设计为任务相关，在局部细节复原中使用逐像素的一维可分类的filter；在local contrast enhancement问题中使用2D局部filter。
3.DR(detail restoration)子网络精巧地恢复高分辨率的HDR输出结果，LCE(local contrast enhancement)子网络有效地恢复局部的曝光度。

Proposed Method

下图为生成器JSINet，分成细节恢复子网络，图像重建子网络和局部对比度增强子网络。
细节恢复子网络(detail restoration subnet): $X_d = X \oslash X_b$ , $X_b$ 是X经过guided filter后的结果； $\oslash$ 表示的是逐像素的乘积；为防止出现除0的情况，在分母 $X_b$ 上加上了一个极小值 $10^{-15}$ 。 $X_d$ 用于生成一维的水平和垂直的可分离filter。最后生成41 $\times$ scale $\times$ scale,41是一维可分离卷积核的长度，scale $\times$ scale代表着超分问题的上采样scale。从而获得动态可分离上采样操作： $X_d {\dot\ast_s}(f_{1D}^v,f_{1D}^h)$
生成的filter是与位置相关的，也是与细节相关的，不同的卷积核用于生成不同细节的特征，而不是使用固定的卷积核用于训练。（dynamic filter for sr）k=41的一维可分离卷积核与9x9的filter的参数几乎是一样的。
局部对比度增强网络：经过guided filter的 $X_b$ 用于增强局部的对比度。LCE子网络在每个像素区域生成一个9x9的二维的local filter。最后生成的LCE结果 $C_l=2\times sigmoid(X_b\dot\ast f_{2D})$
图像重建子网络：如下图所示，最后生成的结果 $(I+D)\times C_l$

在这里插入图片描述
Ablation Study 如下图所示：

Discriminator的设计如下，使用了spectral normalization（借鉴了SN-GAN）用来使GAN训练更加稳定。输出如下：
$D^f(x)=(BN\circ FC1\circ BN \circ FC512 \circ LRL \circ BN \circ 4Conv2\circ DB^4 \circ LRL \circ 3Conv1)(x)$
其中LRL是参数为0.2的LeaKy ReLU，FC $k$ 是有k层输出的全连接层， $k C o n v s$ 代表着k $\times$ k的卷积核。 $DB^n$ 代表着n次DisBlocks层，
使用了RaHinge GAN
$L_{adv}^D=\mathbb{E}_Y[max(0,\tilde{Q}_{Y,P}^{(-)})]+\mathbb{E}_P[max(0,\tilde{Q}_{P,Y}^{(+)})]$
$L_{adv}^G=\mathbb{E}_P[max(0,\tilde{Q}_{P,Y}^{(-)})]+\mathbb{E}_Y[max(0,\tilde{Q}_{Y,P}^{(+)})]$
其中， $\tilde{Q}_{P,Y}^{(\pm)}=1\pm \tilde{D}_{P,Y},\tilde{D}_{P,Y}=D_f(P)-\mathbb{E}_YD_f(Y)$ ,P是生成的图像，Y是GT图像。
同样本文提出了feature-matching loss $L_{fm}=\sum_{i=1}^4 ||f_{m_i}(Y)-f_{m_i}(P)||_2$
最终的损失函数为 $L_G=\lambda_{rec}\cdot ||Y-P||_2 +\lambda_{adv}\cdot(L_{adv}^G+\lambda_d\cdot L_{adv}^{d,G} )+\lambda_{fm}\cdot(L_{fm}+\lambda_d\cdot L_{fm}^d)$
Detail GAN Loss
懒得写了，这个loss可以使得网络训练的更稳定。
在这里插入图片描述

实验结果

略。懒得写了。
在这里插入图片描述

Najlepszy

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
AAAI 2020 SR+ITM论文：JSI-GAN

JSI-GAN: GAN-Based Joint Super-Resolution and Inverse Tone-Mapping with Pixel-Wise Task-Specific Filters for UHD HDR Video摘要欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的...
复制链接

扫一扫

专栏目录