Super-resolution:RankSRGAN: Generative Adversarial Networks with Ranker for Image SR(论文简读二十二)

Title:RankSRGAN: Generative Adversarial Networks with Ranker for Image Super-Resolution

From:ICCV2019

Note data:2019/08/18

Abstract:针对现有方法中无法合理评估生成图像质量问题,采用感知指标来评估感知质量并提出具有Ranker(RankSRGAN)的超分辨生成对抗网络。

Code:未开源


1 Abstract

生成对抗网络(GAN)已经证明了恢复单图像超分辨率(SISR)的真实细节的潜力。 为了进一步提高超分辨率结果的视觉质量,PIRM2018-SR Challenge采用感知矩形来评估感知质量,例如PI,NIQE和Ma。 论文针对现有的方法不能直接优化一些无差异的感知度量问题,提出了具有Ranker(RankSRGAN)的超分辨生成对抗网络。在感知度量方向上优化生成器并生成更加自然的纹理。最吸引人的部分是所提出的方法可以结合不同SR的优势。 产生更好结果的方法。 大量实验表明,RankSR-GAN实现了视觉上令人愉悦的结果,并在感知指标中达到了最先进的性能。


2 Introduction

单图像超分辨率旨在从低分辨率(LR)观察重建/生成高分辨率(HR)图像(超分辨综述)。由于强大的学习能力,卷积神经网络(CNNs)已经证明了优于传统的基于实例的和基于插值的算法的性能。最近基于CNN的方法可以分为两组:

  • 第一个将SR视为重建问题,并采用MSE作为损失函数来实现高PSNR值。

存在的问题:由于重建精度和视觉质量之间的冲突,它们倾向于产生过度平滑/锐化的图像。为了获得更好的视觉质量;

  • 第二组将SR视为图像生成问题。通过结合感知损失和对抗性学习,这些感知SR方法有可能产生逼真的纹理和细节。

感知SR方法面临的最具挑战性的问题是评估。大多数相关工作依靠用户研究来主观评估视觉质量。但是,如果没有像PSNR / SSIM这样的客观度量,很难在公平平台上比较不同的算法,这在很大程度上阻碍了它们的快速发展。为了解决这个问题,提出了许多无参考图像质量评估(NR-IQA)指标,其中一些被证明与人类评级高度相关,如NIQE (相关性0.76)和PI (相关性0.83)。特别地,PIRM2018-SR挑战引入了PI度量标准作为感知标准并成功地对条目进行了排名。然而,这些NR-IQA指标中的大多数都不是可微分的(例如,它们包括手工特征提取或统计回归操作),使得它们不能用作损失函数。在不考虑优化中的NR-IQA度量的情况下,现有的感知SR方法在客观感知标准的方向上不能表现出稳定的性能。

为了克服这个障碍,论文提出了一个通用且可微分的模型 -  Ranker,它可以模拟任何NR-IQA指标并提供明确的目标(作为损失函数)来优化感知质量。 具体来说,Ranker是一个连体CNN,它通过学习排名方法来模拟感知度量的行为。 值得注意的是,由于NR-IQA指标具有各种动态范围,因此Ranker了解其输出排名顺序而非绝对值。 我们为Ranker配备了标准的SRGAN模型并形成了一个新的感知SR框架 -  RankSRGAN(具有Ranker的超分辨率生成对抗网络)。除了SRGAN之外,所提出的框架使用训练有素的Ranker来测量 输出图像质量。 然后可以在特定感知度量的方向上稳定地优化SR模型。


3 Relate work

作者从三个方面对相应的工作进行了介绍以下将分条进行说明:

Super resolution:首先将卷积神经网络(CNN)引入SR任务,一系列基于学习的作品在PSNR方面取得了很大的进步。提出了一系列的相关网络模型,引入纹理匹配和语义先验以提高感知质量。采用NIQE和Ma 组成的感知指数来测量ECCV中PIRM2018-SR挑战中的感知SR方法。ESRGAN通过改进网络架构和损失功能来实现最先进的性能。

CNN for NR-IQA:无参考图像质量评估(NR-IQA)可以通过基于学习的模型实现,该模型从自然场景统计(NSS)中提取手工制作的特征。。对于SR任务,我们期望将感知度量的等级信息引入SR模型训练。

Learning to rank:使用良好学习的排名函数模拟相对属性。首先在统一框架中使用CNN进行相对属性排序。对我们工作最相关的研究之一是RankCGAN ,该研究调查了使用GAN来处理具有语义属性的图像生成任务。与通过噪声输入生成图像的标准GAN不同,RankCGAN将成对的Ranker合并到CGAN架构中,以便它可以使用主观测量来处理连续属性值。


4 Method

4.1 Overview of RankSRGAN

该方法由生成器和判别器组成。 判别器网络试图将 ground-truth与超分辨率结果区分开来,同时训练发电机网络以欺骗判别器。 为了获得更自然的纹理,我们建议通过利用感知度量的先验知识来增加标准SRGAN 的附加约束,以提高输出图像的视觉质量。 我们方法的总体框架如图2所示。

网络概述: 

阶段1:在感知度量的方向上由不同的SR模型生成成对等级图像。

阶段2:训练类似暹罗的排名网络。

阶段3:引入从训练有素的Ranker获得的排名内容损失,以指导GAN培训。 RankSRGAN由生成器(G),鉴别器(D),固定特征提取器(F)和Ranker(R)组成

阶段1:生成成对排名图像。采用不同的SR方法在公共SR数据集上生成超分辨率图像。然后在所生成的图像上应用所选择的感知度量(例如,NIQE)。之后拾取相同内容的两个图像以形成一对,并根据由感知度量计算的质量分数对成对图像进行排名。然后获得成对图像和相关的排名标签。

第二阶段:训练排名。 Ranker采用Siamese架构来学习感知指标的行为,网络结构在3.2节中描述。我们采用余量等级损失,这是“学习排名”中常用的,作为优化Ranker的成本函数。学习的Ranker应该具有根据他们的感知分数对图像进行排名的能力

Stage3:Introducerank-contentloss:一旦Ranker受过良好训练,我们就会使用它来定义标准SRGAN的排名内容损失,以生成视觉上令人愉悦的图像。

4.2 Ranker

 

 

### 回答1: ESRGAN是增强型超分辨率生成对抗网络的缩写,它是一种深度学习模型,用于将低分辨率图像转换为高分辨率图像。它使用生成对抗网络(GAN)的方法,通过训练生成器和判别器来提高图像的质量。ESRGAN是目前最先进的超分辨率算法之一,它可以生成更加真实、细节更加丰富的高分辨率图像。 ### 回答2: ESRGAN是一种增强超分辨率生成对抗网络(Enhanced Super-Resolution Generative Adversarial Networks)的算法,它采用了图像增强技术和深度学习的方法,可以将低分辨率(LR)的图像转化为高分辨率(HR)的图像。该算法主要的贡献在于,它可以生成更加逼真的HR图像,从而更好地应用于实际的图像处理领域。 该算法主要是由两个子模型组成的,一个是生成模型(Generator),另一个是判别模型(Discriminator)。生成模型通过学习HR图像和相应的LR图像之间的关系,生成更加逼真的HR图像。而判别模型则评估生成模型生成的HR图像是否真实,从而提高生成模型的准确度。 ESRGAN算法采用特殊的损失函数,即感知损失和自适应增强损失,来优化生成模型。感知损失通过VGG网络来计算生成模型和HR图像之间的差异,以此来调整生成模型的参数。自适应增强损失则用于动态调整生成模型的输出图像的细节层次,使生成模型产生更加真实的输出图像。 ESRGAN算法在图像增强领域取得了显著的成果,其生成的HR图像质量要比先前的SRGAN算法有了很大的提升。因此,ESRGAN算法在实际应用中具有广泛的前景,可以为图像处理领域提供更加高效、准确和可靠的方法。 ### 回答3: ESRGAN(Enhanced Super-Resolution Generative Adversarial Networks)是一种利用深度学习算法进行图像超分辨率的技术。其主要思路是基于GAN模型,通过训练一个生成器去从低分辨率图像生成高分辨率图像,同时以高分辨率的真实图片为样本来训练判别器模型,使其能够区分出生成器生成的图像是否为真实高清图像。 ESRGAN相对于传统的超分辨率算法,具有以下几个优点: 1.超分辨率效果更好。传统的超分辨率算法往往是基于一些数学模型进行插值运算,因此往往会出现图像模糊、失真等问题。而ESRGAN能够通过深度学习算法学习到更加准确的纹理特征,从而可以生成更为真实的高清图像。 2.可扩展性更强。ESRGAN的GAN模型可以通过增加网络深度、增加训练数据等方式对模型进行优化,从而提高图像超分辨率效果。 3.针对性更强。ESRGAN可以针对不同种类的图像进行训练,从而能够对各种类型的图像进行超分辨率处理,具有广泛的适用性。 4.易于应用。ESRGAN训练出的模型可以很方便地应用到实际生产环境中,对于需要进行图像超分辨率处理的应用场景具有很大的帮助作用。 虽然ESRGAN在图像超分辨率方面具有较为突出的优势,但其也存在一些缺点和挑战。比如需要大量的高清图像数据用于训练,需要考虑到训练时间和计算资源的问题;还需要解决一些局部纹理复杂的图像超分辨率问题。总之,ESRGAN是一种非常有潜力的图像超分辨率算法,将有助于推动图像处理技术的进一步发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值