论文笔记 | 【CVPR2023】OPE-SR

最新推荐文章于 2023-07-27 23:58:45 发布

七水合硫酸亚铁有点脆

最新推荐文章于 2023-07-27 23:58:45 发布

阅读量817

点赞数 3

分类专栏： Low-level 文章标签：论文阅读人工智能机器学习

本文链接：https://blog.csdn.net/CrispyFeSO_4/article/details/130449949

版权

Low-level 专栏收录该内容

10 篇文章 4 订阅

订阅专栏

论文笔记 | 【CVPR2023】OPE-SR: Orthogonal Position Encoding for Designing a Parameter-free Upsampling Module in Arbitrary-scale Image Super-Resolution

CVPR2023，总共有5篇任意超分。
找时间都读一读吧，咋任意超分已经这么火了捏。

1 Review of LIIF

在这里插入图片描述

2 Motivation & Contribution

Motivation：

1.基于隐式神经表示（INR）【LIIF中的MLP】的上采样模块增加网络复杂性。
MLP与特征提取网络需要联合训练。

2.重建对MLP有依赖性，然而MLP在学习图像的对称性特征时存在局限性，导致翻转一致性下降（flipping consistency decline），具体表现为：特征图水平翻转后，目标图像变模糊。
在这里插入图片描述
解决方案：不使用MLP。
MLP是一个通用的函数逼近器，试图拟合一个从Feature map到HR图像的映射函数。那么这个映射函数，又可以使用一组解析解来求解。
因此文章使用2组正交基构建的一个大正交基，使用该正交基的线性组合用于拟合这个映射函数。在该基础上构建了OPE上采样模块，这是一个无参数的模块，简化了SR框架。

Contribution：
OPE编码+OPE模块+解决MLP翻转一致性问题+保持性能的同时减少计算和内存消耗

3 Method

个人感觉文章写得比较晦涩。有一些细节论文没有写得很清楚，我大致看了代码，如果没有讲清楚的再讨论罢。
一些数学推导我自己推了，但是就不详细展开了，只展开技术方面的部分。
为了方便理解，我转换一下讲述顺序。

3.1 正交基与OPE编码

对于一个待超分的图像patch，它可以通过一个映射函数f，从LR映射到HR。
这个f函数接受输入x,y，映射到输出像素值。
在这里插入图片描述
现在我们希望用一组正交基来拟合这个映射。

正交基：
平面中的2个不重叠的向量，可以通过线性组合表示平面内任意一个向量，这两个向量称为一组基向量。如果这两个向量垂直（正交），就是一组正交基向量。扩展到三维，四维，n维，都可以成立。
向量本质也是一种映射，从一个点，映射到一个点。
希望用一组正交基，来拟合这个f映射，实际上也就是得到这个上采样的方式。只要正交基定了，就只需要确定前面的系数了。

正交基怎么确定？用一组（x,y）坐标确定。
首先它给出了一组基础的正交基γ，可以证明它是正交的。
GPT的答案：证明每两个向量内积都为零，并且每个向量都是单位向量。
我自己证过了，就不展开了。
在这里插入图片描述

对于一个x，可以通过γ()函数确定出一组正交基，同样y也可以确定出一组正交基，记为X和Y，他们的维度都是(2n+1)。

在这里插入图片描述

把X的转置和Y相乘，得到一个(2n+1)×(2n+1)的向量，展平（flatten），得到一个
(2n+1)^2的向量，记为P。
在这里插入图片描述

这个P依然是一个正交基，因为它满足其中的任意两两相乘都是0（现在的两两相乘，相当于以前的四个相乘。以前的两两相乘为零，两个0相乘依然为零）；满足任意一个都是单位向量（相当于原来的两两相乘，两个单位三角函数向量相乘依然是单位向量）。
所以P可以认为是一组维度是(2n+1)^2的正交基。
在这里插入图片描述