SRGAN简记

SRGAN简记

  • 它是第一个能够推断4×放大因子的照片真实自然图像的框架
  • 作者将GAN的思想用于SR任务,虽然PSNR还比不上此前提出的方式,但是在MOS这一评价维度上达到了state-of-the-art
  • 作者的贡献是:
    • 提出了SRResNet(SRCNN的增强版)
    • 提出了SRGAN(主要内容,引入GAN来做超分)
    • 引入MOS评价指标,并说明PSNR的一些问题(图像过于平滑,缺少高频细节信息,所谓高频即在频域中频率较高的部分,通常认为这部分用于保存图像细节信息)
参考
模型结构
  • GAN分为Generator和Discriminator两个部分,其中Generator用于图像超分,Discriminator用于判定超分图和原图
LOSS定义
  • 整体的LOSS分为两个部分,分别是Content Loss 和adversarial loss,
  • image-20220111151627057
Content Loss
  • 内容损失loss,此前用的一般是MSE,这种LOSS拥有比较好的PSNR(峰值信噪比),但是通常来说回丢失高频信息,导致图像过于平滑(一般我们认为图像中的细节信息大部分存在高频部分),因此作者由欧几里得距离提出了 I X S R I_{X}^{SR} IXSR,如下所示
  • image-20220111152543951
  • 其中X替代为VGG(意思是Backbone用的VGG,可替换), ϕ i , j 表 示 第 i t h 个 m a x p o o l 之 前 的 第 j t h 个 c o n v l o t i o n \phi_{i,j}表示第i_{th}个maxpool之前的第j_{th}个conv lotion ϕi,jithmaxpooljthconvlotion,然后H和W表示feature map的空间维度。
Adversarial loss
  • 为对抗loss,是生成器和检测器之间的loss,类似交叉熵但好像并不是,这里由于我们希望生成器的结果被检测器误认为是nature的图片,所以希望最小化检测器认为是生成器生成的概率(也就是使得D的结果趋向于1)
  • image-20220111152951118
实验
  • 有关于MOS的结果,SR GAN在Set5和Set14数据集上的MOS分数均比SRResNet(可以看作SR CNN的增强版)高不少

  • image-20220111153923438

  • MOS评级分布,可以看到SRResNet高于此前的方法,而SRGAN又超过了SRResnet。

  • image-20220111154147550

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

椰子奶糖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值