论文笔记(Restormer)

三斤驴肉花

已于 2023-03-12 13:26:53 修改

阅读量992

点赞数 1

文章标签：论文阅读人工智能 python 计算机视觉 cnn Powered by 金山文档

于 2023-03-12 13:18:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Karl51/article/details/129474693

版权

15.Restormer

1.创新点：

1.提出了Restormer，一种编码器-解码器转换器，用于高分辨率图像上的多尺度局部全局表示学习，而无需将它们分解到局部窗口，从而利用遥远的图像上下文。

2.我们提出了一个多dconv头部转移注意力(MDTA)模块，它能够聚合局部和非局部像素交互，并且足够有效地处理高分辨率图像。

3.一种新的门控dconv前馈网络(GDFN)，它执行受控的特征转换，即抑制信息较少的特征，只允许有用的信息在网络层次结构中进一步传递。

4. 通过渐进式学习在混合大小的补丁上训练的模型在测试时表现出了增强的性能，其中图像可以具有不同的分辨率(图像恢复中的常见情况)。随着补丁大小的增加，我们减少批大小，以保持每个优化步骤与固定补丁训练的时间相似。

2.整体网络结构：

1. 编码器-解码器的每一层都包含多个Transformer块，其中块的数量从上到下逐步增加，以保持效率。

2. 连接操作之后是1×1卷积，以减少所有级别的通道(一半)，除了顶部的。

3. MDTA：键是跨通道而不是空间维度应用SA，即计算跨通道的交叉协方差，生成隐式编码全局上下文的注意图。在计算特征协方差生成全局注意图之前，对局部上下文进行深度卷积。

4. GDFN：改进点：(1)门控机制；(2)深度卷积。

3.实验对比:

4.消融实验：

通过深度卷积将局地性引入MDTA可以提高鲁棒性，因为去除会导致PSNR下降。

5.学习总结：

1. Transformer模型虽然弥补了CNN的缺点(接受域有限，不适应输入内容)，但其计算复杂度随空间分辨率的增加呈二次增长，因此无法应用于大多数涉及高分辨率图像的图像恢复任务。

2. 卷积算子有一个有限的接受域，从而阻止它对长像素依赖性的建模。卷积滤波器在推理时具有静态权值，因此不能灵活地适应输入内容。为了解决上述缺点，一种更强大和动态的替代方法是自注意(SA)机制，它通过所有其他位置的加权和来计算给定像素处的响应。

3. 很少有工作去为图像恢复做专门的transformer，如果通过限制SA的空间范围来方便使用，与捕捉真正的长程像素关系的目标是矛盾的，特别是在高分辨率图像上。

4. 与SwinIR相比，Restormer的flop次数少了3.14倍，运行速度快了13倍。

三斤驴肉花

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
论文笔记(Restormer)

论文阅读（Restormer）
复制链接

扫一扫

三斤驴肉花 CSDN认证博客专家 CSDN认证企业博客

码龄3年

17: 原创

136万+: 周排名

208万+: 总排名

6243: 访问

: 等级

183: 积分

2: 粉丝

5: 获赞

22: 评论

18: 收藏

私信

关注

热门文章

最新评论

论文笔记(WTCRR)
m0_63931428: 如果输入的图像是奇数边长，比如625X625，那么模型该怎么进行DWT及IWT呢？
论文笔记(WTCRR)
三斤驴肉花: 我感觉这个就是上采样过去吧，只是没说这一步，不上采样确实对不上，假如先放大xS再小波，那就是上采样到S/2然后塞进去一起算
论文笔记(WTCRR)
精神小可以燎原: “利用单层二维离散小波变换(DWT)将LR图像分解为LR小波分量的4个子带，并将低频子带替换为LR图像。” 就是这个低频子带的替代
论文笔记(WTCRR)
精神小可以燎原: 博主你好，我最近也刚看了这篇论文，有个问题就是，这个放大因子要怎么控制呢，比如要放大三倍的话，小波变换之后是0.5倍，那双三次插值再小波变换的图像就是1.5倍，那还怎么用原低分辨率图像去替代小波分量呢
论文笔记(Restormer)
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。