ZSSR-“Zero-Shot” Super-Resolution using Deep Internal Learning论文详解

最新推荐文章于 2025-01-22 17:15:03 发布

高启强668

最新推荐文章于 2025-01-22 17:15:03 发布

阅读量4.3k

点赞数 6

分类专栏：深度学习超分SR 文章标签：深度学习神经网络

本文链接：https://blog.csdn.net/zhognsc08/article/details/106885341

版权

深度学习同时被 2 个专栏收录

7 篇文章

订阅专栏

超分SR

6 篇文章

订阅专栏

介绍了一种名为ZSSR的零样本超分辨率算法，该算法利用深度学习技术，针对每张图像进行无监督训练，以克服现有基于CNN的超分辨率方法在真实世界图像上的局限性。ZSSR利用图像内部的重复性信息，适用于各种成像条件和数据类型，无需预训练，可在任意分辨率和纵横比下工作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文下载：https://arxiv.org/pdf/1712.06087.pdf CVPR2018

GitHub：https://github.com/assafshocher/ZSSR TensorFlow版本

项目：http://www.wisdom.weizmann.ac.il/~vision/zssr/

Abstract

1.目前使用基于CNN的SR，都是监督方法，且限定于特定的数据，预先从HR图像中得到LR图像（通常是三立方插值），而没有任何的噪声或伪影，但真实图像上往往有这些信息，所以SOTA算法效果都不理想。

2.提出了一种“Zero-Shot” SR算法，使用了深度学习的方法，但不依赖先前的训练，对每张图使用小型CNN网络进行无监督训练，并输出SR结果。

3.利用图像内部的重复性信息。

4.可以适用每张图像的不同设置（不同缩放内核，缩放比例等），可以对未知或者不理想的真实图像进行SR，在这类图像上，ZSSR要优化SOTA监督SR算法，这是第一个非监督的基于CNN的SR算法。

Introduction

目前使用基于CNN的SR方法，比传统SR算法要好很多了，但是只能对满足他们预设条件的图像效果才好，而真实世界的图片，比如从互联网下载的，手机拍的以及老照片，效果就不理想了。

图像内部出现重复信息是这个真实世界图像一个很强的特征，内部信息熵比外部图像要小很多，这是无监督SR算法的基础。

文章主要贡献：

1.这是第一个基于CNN的无监督SR方法。

2.它可以处理非理想的成像条件，以及各种各样的图像和数据类型（即使是第一次遇到）。

3.它不需要预训练，并且可以使用少量的计算资源来运行。

4.它可以应用于任何大小的SR，并且在理论上也可以具有任何纵横比。

5.可以适应已知和未知的成像条件（在测试时）。

6.在“非理想”条件下图像上是最先进的SOTA SR，在“理想”条件下训练的结果也可以和目前基于监督的SotA方法媲美。

Internal Image Statistics

自然图像具有强大的内部数据重复性，内部图像统计通常比从一般图像获得的外部统计提供更强的预测能力。下图中，基于内部块匹配的算法能够学到栏杆信息，基于监督的算法却学不出来，因为他们是依靠大量的外部图像，没有充分利用图像内部的重复性。

Image-Specific CNN

对测试图片进行下采样得到LR图，和测试图构成LR-HR对，使用小型网络进行训练，将测试图输入到训练好的网络，就得到最终需要的SR图。网络是全卷积的，所以可以处理任何分辨率。

Data augmentation

对输入图先进行各种比例的下采样（比例较小）标记为HR-fathers，再进行0,90,180,270度旋转和垂直和水平翻转，然后再下采样，标记为LR-sons，构成LR-HR数据对。

为了能够对输入图分辨率较低，但又能做较大缩放比例的SR，中间有几个等级的缩放比例，论文里是6个，通过这6个达到需要的缩放比例，每个阶段生成的SR图像，又会当做新的HR-father，进行同样的数据扩展，添加到下一阶段的缩放比例训练中。例如，需要宽高上采样2.0，6个阶段划分为[[1.0, 1.5], [1.5, 1.0], [1.5, 1.5], [1.5, 2.0], [2.0, 1.5], [2.0, 2.0]= [2.0, 2.0]，其中[1.5,1.5]和[2.0,2.0]应该是没有缩放