CVPR2023_N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution 论文阅读记录_1

长风破浪会有时_Tzz

已于 2023-09-28 21:52:24 修改

阅读量980

点赞数 2

分类专栏：超分辨率论文阅读笔记文章标签：论文阅读计算机视觉

于 2023-09-09 16:07:28 首次发布

本文链接：https://blog.csdn.net/weixin_43755178/article/details/132773319

版权

超分辨率论文阅读笔记专栏收录该内容

6 篇文章 2 订阅

订阅专栏

论文原文：https://arxiv.org/abs/2211.11436

针对问题：

原始的基于Swin-Transformer的超分辨率网络主要会面临一下两方面问题：

原始网络其感受野较小。（它使得网络不受到相邻窗口的影响，从而产生失真的图像）
原始网络具有较大的计算量。

问题说明：

问题A：如图二的h所示，红色方框的特征与邻居特征具有较为明显的不同，从而导致（e）红色方框中出现了失真现象。
问题B：如图（f、g），红色方框与邻居方框色彩有着较为明显的不同，说明网络在推理时没有利用到邻居特征。
上一行本文提出的方法，下一行是原始Swin产生的特征结果图。
N-Gram的定义
N-Gram的概念已经出现在语言模型中，其主要就是将目标词语的前后词语当作辅助信息输入即可。而图像中的N-Gram概念与其类似。

在这里插入图片描述

网络的整体架构

在这里插入图片描述

文章的重点主要为NSTB（架构如下）
在这里插入图片描述

N-Gram Window Partition主要由一下几步构成

对图像中的块分别进行特征提取，得到特征块（uni-Gram形式）。
对得到的多个特征快分别计算其WSA即得到了Forward-Gram以及Backward-Gram，其中特征的边缘可能出现前后没有特征值的问题。本文避免利用填充0的方案，对于Forward-Gram填充右下角的特征，填充值为填充边缘左边一格特征或者上面一格的特征值。对于Backward-Gram则填充左上角特征，同样填充值为右边一格或者下面一格的特征值。

在这里插入图片描述

3. 利用一个卷积网络将Forward-Gram与Backward-Gram进行融合。
4. 将融合后的Gram作为偏置项添加到原始输入的特征中。

实验

引入N-Gram的消融实验
在这里插入图片描述
与其他网络的对比实验

长风破浪会有时_Tzz

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
CVPR2023_N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution 论文阅读记录_1

N-Gram的概念已经出现在语言模型中，其主要就是将目标词语的前后词语当作辅助信息输入即可。而图像中的N-Gram概念与其类似。问题A：如图二的h所示，红色方框的特征与邻居特征具有较为明显的不同，从而导致（e）红色方框中出现了失真现象。问题B：如图（f、g），红色方框与邻居方框色彩有着较为明显的不同，说明网络在推理时没有利用到邻居特征。3. 利用一个卷积网络将Forward-Gram与Backward-Gram进行融合。4. 将融合后的Gram作为偏置项添加到原始输入的特征中。引入N-Gram的消融实验。
复制链接

扫一扫