Meta-SR：A Magnification-Arbitrary Network for Super-Resolution 论文阅读笔记

最新推荐文章于 2024-08-03 16:08:53 发布

BieberChen

最新推荐文章于 2024-08-03 16:08:53 发布

阅读量619

点赞数 1

分类专栏：超分辨率文章标签： super resolution 深度学习

本文链接：https://blog.csdn.net/BieberChen/article/details/97389732

版权

超分辨率专栏收录该内容

0 篇文章 0 订阅

订阅专栏

Meta-SR：A Magnification-Arbitrary Network for Super-Resolution 论文阅读笔记

论文链接

本文主要的创新点：

提出了Meta-Upscale module,首次通过dynamically predict weights,实现了单一模型对输入图片进行任意尺度的上采样

Feature Learning Module

feature learning module与普通的超分网络一样，本文使用RDN(residual dense network)作为超分网络，RDN网络结构包含3个卷积层以及16个residual dense blocks(RDBs) ,RDB结构如上图所示，每个RDB包含8个卷积层，特征通道数为64。

Meta-Upscale Module

利用Feature Learning Module提取特征 $F^{LR}$ ,假设上采样尺度因子为 $r$ ，对SR图像中的每个像素点 $(i, j)$ 的值，都由 $F^{LR}$ 中的像素点 $(i^{'}, j^{'})$ 和相对应的卷积核决定。因此，首先，up-scale module需要将 $(i, j)$ 与 $(i^{'}, j^{'})$ 对应，然后利用一个特殊的卷积核，根据 $(i^{'}, j^{'})$ 的值求得SR图像中 $(i, j)$ 位置的像素值。up-scale formulate如下：

$I^{SR}(i,j)=\Phi(F^{LR}(i^{'}, j^{'}), W(i,j))$

其中， $\Phi(\cdot)$ 代表feature mapping function用来计算pixel value。 $W (i, j)$ 代表计算SR中像素点 $(i, j)$ 时的卷积核。

由于SR图像中的每个像素点都与卷积核有关，对于不同的尺度因子 $r$ ,卷积核的weights都不相同，为了实现任意尺度的超分，本文提出了基于尺度因子和坐标的Meta-Upscale Module来动态预测weights $W (i, j)$ 。Meta-Upscale Module由三个重要的模块组成：Location Projection, Weights Prediction以及Feature Mapping

Location Projection

对于SR图像中的每个像素点 $(i, j)$ ,均需找到 $F^{LR}$ 中的一个像素点 $(i^{'},j^{'})$ 与之相对应。
$(i^{'},j^{'})=T(i,j)=(\lfloor \frac{i}{r} \rfloor, \lfloor \frac{j}{r} \rfloor)$

其中， $T$ 是transformation function， $\lfloor \rfloor$ 是向下取整函数。

The schematic diagram for how to upscale the feature map with the non-integer scale factor r=1.5. Here we only show the one-dimensional case for simplify.

如上图所示，当尺度 $r = 2$ 时， $F^{LR}$ 中的每个像素点 $(i^{'},j^{'})$ 决定SR图像中的两个点，当尺度尺度 $r$ 为非整数时，如尺度 $r = 1.5$ 时， $F^{LR}$ 中的有些像素点决定SR图像中的两个点，有些决定SR图像中的一个点。

Weights Prediction

对于传统的upsale module，不同的尺度因子都有与之对应的、从训练集中学到的卷积核 $W$ 。但是，本文的Meta-Upscale Module利用神经网络来预测weights，公式如下：
$W(i,j)=\varphi(v_{ij};\theta)$
其中， $W (i, j)$ 为SR中像素点 $(i, j)$ 卷积核， $\varphi(\cdot)$ 时weight prediction network, $v_{ij}$ 是网络的输入，与像素点 $(i, j)$ 有关， $\theta$ 是weight prediction network的参数。
$v_{ij}=(\frac{i}{r}-\lfloor \frac{i}{r}\rfloor,\frac{j}{r}-\lfloor \frac{j}{r}\rfloor)$
为了同时训练不同尺度的超分网络，最好将尺度因子加入到 $v_{ij}$ 中。理由：如果你想对一张图像做2倍和4倍超分，假设分别用 $I_2^{SR}$ 和 $I_4^{SR}$ 表示超分图像,由于 $I_2^{SR}$ 中的像素点 $(i, j)$ 和 $I_4^{SR}$ 中像素点 $(2 i, 2 j)$ 对weight prediction network的输入相等：
$v_{ij}=(\frac{i}{2}-\lfloor \frac{i}{2}\rfloor,\frac{j}{2}-\lfloor \frac{j}{2}\rfloor)=(\frac{2i}{4}-\lfloor \frac{2i}{4}\rfloor,\frac{2j}{4}-\lfloor \frac{2j}{4}\rfloor)=v_{2i2j}$
从而使得weight prediction network预测的卷积核相同（这意味着 $I_2^{SR}$ 是 $I_4^{SR}$ 的子图），进而严重影响最后超分的性能，因此，将尺度因子加入到 $v_{ij}$ 中。

$v_{ij}=(\frac{i}{r}-\lfloor \frac{i}{r}\rfloor,\frac{j}{r}-\lfloor \frac{j}{r}\rfloor, \frac{1}{r})$

Feature Mapping

在利用Feature Learning Module得到 $F^{LR}$ 、利用weight prediction network得到卷积核后，要做的最后一件事情就是mapping feature to the value of the pixel on the SR image.公式如下：
$\Phi(F^{LR}(i^{'},j^{'}),W(i,j))=F^{LR}(i^{'},j^{'})\cdot W(i,j)$

本文提出的Meta-Upscale Module流程如下图所示：

Meta Upscale Module详细过程：

根据尺度因子 $r$ 找到 $I^{SR}$ 中的像素点 $(i, j)$ 在低分图像 $F^{LR}$ 中的对应点 $(i^{'},j^{'})=(\frac{i}{r}-\lfloor \frac{i}{r}\rfloor,\frac{j}{r}-\lfloor \frac{j}{r}\rfloor)$ 。
求得weight prediction network的输入向量（每个点对应3个数，横纵坐标的增量以及尺度因子， $I^{SR}$ 中共有 $H\times W$ 个像素点，因此共有 $H\times W\times 3$ 个数，如图1所示） $v_{ij}=(\frac{i}{r}-\lfloor \frac{i}{r}\rfloor,\frac{j}{r}-\lfloor \frac{j}{r}\rfloor, \frac{1}{r})$ ，网络输出 $H\times W$ 个大小为 $k\times k\times inC\times outC$ 的卷积核。
$F^{LR}$ 的大小为 $N\times inH\times inW\times inC$ ,对于 $I^{SR}$ 中的像素点 $(i, j)$ , 找到与之对应的 $F^{LR}$ 中的像素点 $(i^{'},j^{'})$ 以及以 $v_{ij}$ 为输入的weight prediction network预测的卷积核 $W (i, j)$ (尺寸为 $k\times k\times inH\times inW$ )
将 $F^{LR}$ 中以像素点 $(i^{'},j^{'})$ 为中心的 $k\times k$ 的区域与 $W (i, j)$ 做卷积，最终得到 $I^{SR}$ 中的像素点 $(i, j)$ 。

结果

在这里插入图片描述

BieberChen

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Meta-SR：A Magnification-Arbitrary Network for Super-Resolution 论文阅读笔记

Meta-SR：A Magnification-Arbitrary Network for Super-Resolution 论文阅读笔记论文链接本文主要的创新点：提出了Meta-Upscale module,首次通过dynamically predict weights,实现了单一模型对输入图片进行任意尺度的上采样Feature Learning Modulefeature le...
复制链接

扫一扫

专栏目录