深度学习_GAN_ESRGAN论文详解

最新推荐文章于 2025-04-13 22:31:21 发布

Rocky Ding*

最新推荐文章于 2025-04-13 22:31:21 发布

阅读量2.3k

点赞数

分类专栏： # GAN 文章标签：深度学习神经网络机器学习 GAN ESRGAN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Rocky6688/article/details/106171236

版权

GAN 专栏收录该内容

16 篇文章

订阅专栏

ESRGAN，一种基于生成对抗网络的超分辨率增强模型，通过改进SRGAN的网络结构和损失函数，引入RRDB结构及激活前的VGG特征，提升了图像恢复的纹理细节和亮度一致性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ESRGAN（Enhanced Super-Resolution Generative Adversarial Networks）主要是对SRGAN进行改进，发表于2018年，可以说是超分辨率领域很强的一个模型。

主要改进点

引入了Residual-in-Residu Dense Block（RRDB）结构。
改进了网络结构和损失函数。
使用激活前的VGG特征来改善感知损失。

RRDB结构详解

在这里插入图片描述

这个结构主要是针对RB结构中的BN层进行改进，由于作者任务SRGAN中产生伪影的原因是因为使用了BN层，所以作者去除了BN层；接着作者使用了dense connections的方法对feature map进行密集连接。

损失函数的改进

在SRGAN中，判别器判别的是输入图片是否是“真的”高清图像还是“假的”高清图像，在ESRGAN中，作者提出了一种新的思考模式（借鉴了relativistic GAN的想法），使用判别器是来估计真实图像相对来说比fake图像更逼真的概率。

在这里插入图片描述

其中，判别器的损失为：

在这里插入图片描述

生成器的损失为：

在这里插入图片描述

其中 $x_f$ 是生成器生成的图片， $x_r$ 是原始的输入LR图片。

改善感知损失

在这里插入图片描述

右上图可知，使用激活前的特征，这样可以为亮度一致性和纹理恢复提供更强的监督。

感知域的损失在SRGAN中是定义在一个预训练的深度网络的激活层，这一层中两个激活了的特征的距离会被最小化。与此相反，作者使用的特征是激活前的特征，这样就可以克服两个缺点：

激活后的特征是非常稀疏的，特别实在很深的网络中。这种稀疏的激活提供的监督效果是很弱的，会造成性能低下。
使用激活后的特征会导致重建图像与GT的亮度不一致。

作者也提出了一种更适合于超分辨率的感知域损失，这个损失基于一个用于材料是别的VGG16网络（MINCNet），这个网络更聚焦于纹理而不是物体。尽管这样带来的增益很小，但作者依然相信，探索关注纹理的感知域损失对超分辨率至关重要。

网络插值

为了平衡感知质量和PSNR等评价值，作者提出了一个灵活并且有效的方法——网络插值。具体而言，作者首先基于PSNR方法训练得到网络G_PSNR，然后再用基于GAN的网络G_GAN进行微调。

然后，对这两个网络相应的网络参数进行插值得到一个插值后的网络G_INTERP：

在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Rocky Ding* 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。