SRGAN简记

最新推荐文章于 2022-03-16 19:17:14 发布

椰子奶糖

最新推荐文章于 2022-03-16 19:17:14 发布

阅读量1.5k

点赞数

分类专栏： # 论文阅读杂记文章标签：计算机视觉深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/symuamua/article/details/122434460

版权

论文阅读杂记专栏收录该内容

51 篇文章 1 订阅

订阅专栏

SRGAN简记

文章目录

- - SRGAN简记

它是第一个能够推断4×放大因子的照片真实自然图像的框架
作者将GAN的思想用于SR任务，虽然PSNR还比不上此前提出的方式，但是在MOS这一评价维度上达到了state-of-the-art
作者的贡献是：
- 提出了SRResNet（SRCNN的增强版）
- 提出了SRGAN（主要内容，引入GAN来做超分）
- 引入MOS评价指标，并说明PSNR的一些问题（图像过于平滑，缺少高频细节信息，所谓高频即在频域中频率较高的部分，通常认为这部分用于保存图像细节信息）

参考

模型结构

GAN分为Generator和Discriminator两个部分，其中Generator用于图像超分，Discriminator用于判定超分图和原图

LOSS定义

整体的LOSS分为两个部分，分别是Content Loss 和adversarial loss，

Content Loss

内容损失loss，此前用的一般是MSE，这种LOSS拥有比较好的PSNR（峰值信噪比），但是通常来说回丢失高频信息，导致图像过于平滑（一般我们认为图像中的细节信息大部分存在高频部分），因此作者由欧几里得距离提出了 $I_{X}^{SR}$ ，如下所示
其中X替代为VGG（意思是Backbone用的VGG，可替换）， $\phi_{i,j}表示第i_{th}个maxpool之前的第j_{th}个conv lotion$ ，然后H和W表示feature map的空间维度。

Adversarial loss

为对抗loss，是生成器和检测器之间的loss，类似交叉熵但好像并不是，这里由于我们希望生成器的结果被检测器误认为是nature的图片，所以希望最小化检测器认为是生成器生成的概率（也就是使得D的结果趋向于1）

实验

有关于MOS的结果，SR GAN在Set5和Set14数据集上的MOS分数均比SRResNet（可以看作SR CNN的增强版）高不少
MOS评级分布，可以看到SRResNet高于此前的方法，而SRGAN又超过了SRResnet。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
SRGAN简记

SRGAN简记文章目录SRGAN简记模型结构LOSS定义Content LossAdversarial loss实验它是第一个能够推断4×放大因子的照片真实自然图像的框架作者将GAN的思想用于SR任务，虽然PSNR还比不上此前提出的方式，但是在MOS这一评价维度上达到了state-of-the-art作者的贡献是：提出了SRResNet（SRCNN的增强版）提出了SRGAN（主要内容，引入GAN来做超分）引入MOS评价指标，并说明PSNR的一些问题（图像过于平滑，缺少高频细节信息，所谓高频
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

椰子奶糖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。