Fourier Space Losses for Efficient Perceptual Image Super-Resolution

在这里插入图片描述


前言

本文来自2021的ICCV,其创新点主要是将傅里叶系数应用到损失函数上。

图像超分辨率的目的是从相应的低分辨率(low-resolution,LR)输入构建高分辨率(high-resolution,HR)图像。

一、摘要

作者指出:
1.图像在超分辨率任务中,其中的高频信息难以被恢复
2.现在的SR网络参数量过大,网络太深,效率不高,不便于部署到移动设备上

现在解决这种性能和效率的方法主要有三种:1)确定任务的最佳架构设计;2)设计更好的优化损失,用于更好利用网络性能;3)数据的数量和质量对最大化性能起着关键作用。本文主要基于第二种方法改进。

感知损失的设计还是集中在空间域中。但是,超分主要还是在下采样过程中,丢失了频谱空间的高频信息。因此,本文提出了一种用于频域的损失函数。

二、创新点

1.提出了一种用于频域的损失函数,用于复原图像的高频信息

用复杂正交基函数,获得对应的频率成分 {x}u,v:
在这里插入图片描述

对图像每个通道进行傅里叶变换。每个复杂成分 {x}u,v 可以分解为振幅和相位:
在这里插入图片描述
SR处理的问题是生成缺失的频率,即从低频到高频的探索。与空间域相比,可以在频域上清晰地分离特定的频率。此外,傅里叶成分能够提供图像的全局信息。基于此,设计相应的损失函数。

本文所用损失:

监督损失:
1.空间域损失

1.L1监督损失:
在这里插入图片描述
2.VGG损失(VGG54):

在这里插入图片描述

2.频域损失

首先,将真实图像和生成图像经过Hann window预处理。
接着,计算傅里叶频域损失函数,包括L1范数度量的频谱差异,以及相位角差异。
在这里插入图片描述
最后,将上述损失函数,直接用于傅里叶空间。

2.为频域损失设计一个新的判别器

在这里插入图片描述由于傅里叶变换造成的空间不变性假设的失效,本文不使用卷积层,而采用全连接层

3.整体的损失包括以下三个部分: 空间域和频域的监督损失,以及GAN损失,还有VGG损失

在这里插入图片描述

实验

训练集:DIV2K、Flickr2K
测试集:Urban100

1.对比实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.消融实验

在这里插入图片描述

总结

这篇文章第一个成功地将基于GAN的损失直接应用于SR的傅里叶成分,生成器主干的运行时间可以减少到只有41ms,比ESRGAN快13倍以上,比GPU上的SRFlow快48倍。

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值