[2025CVPR-图象分类方向]CATANet：用于轻量级图像超分辨率的高效内容感知标记聚合

最新推荐文章于 2025-12-08 16:38:51 发布

原创

最新推荐文章于 2025-12-08 16:38:51 发布 · 1.2k 阅读

·

20

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #计算机视觉 #分类 #目标检测 #图像处理 #深度学习 #机器学习

1. 研究背景与动机

问题：Transformer在图像超分辨率（SR）中计算复杂度随空间分辨率呈二次增长，现有方法（如局部窗口、轴向条纹）因内容无关性无法有效捕获长距离依赖。
现有局限：
- SPIN等聚类方法依赖稀疏聚类中心传播信息，导致近似粗糙且推理速度慢（需迭代更新中心）。
- ATD引入字典学习但计算负担大，不适合轻量化场景。
解决方案：提出 CATANet，通过内容感知令牌聚合实现高效长距离依赖建模，兼顾性能与速度。

2. 方法设计

2.1 整体架构

三阶段流程：

浅层特征提取：3×3卷积映射LR图像至高维特征。
深层特征提取：K个残差组（RG），每个RG包含：
- 令牌聚合块（TAB）：核心创新模块。
- 局部区域自注意力（LRSA）：增强局部细节。
- 3×3卷积：细化特征并学习位置嵌入。
图像重建：全局残差信息 + LR上采样 → 输出HR图像。

2.2 令牌聚合块（TAB）<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

清风AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。