- 博客(1148)
- 资源 (13)
- 收藏
- 关注
原创 【图像增强(Image Enhancement )】专栏的相关说明,包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、关于答疑、文章目录、与我联系等(持续更新中...)
专栏内涉及的算法都是基于深度学习的图像增强算法;收录的文章基本上是基于Pytorch框架实现的,部分基于Tensorflow;预计完成100篇论文,并持续更新;专栏内文章主要为两部分:【论文精读】与【论文复现】论文精读:读懂论文,总结提炼,聚焦核心内容,不只是全文翻译论文复现:跑通流程,源码解析,提升代码能力,得到去噪结果以及指标计算综合而言,从大到小拆解模型结构,从小到大实现模型搭建。实现论文与源码的统一,深入理解论文行文逻辑与代码实现逻辑,融汇贯通二者思想,并学以致用。
2025-09-01 15:56:57
3798
6
原创 【图像去噪(Image Denoising)】关于【图像去噪】专栏的相关说明,包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总(更新中)
你是否在全网苦寻【图像去噪(ImageDenoising)】的相关资料?你的目标是否是看懂【图像去噪(ImageDenoising)】的相关论文,复现代码,跑出结果,并试图创新?你是否需要发表【图像去噪(ImageDenoising)】的相关论文毕业?你是否需要做【图像去噪(ImageDenoising)】的相关项目,开发软件,研究算法,获得专利或者软著?只要是与【图像去噪(ImageDenoising)】有关的问题,那么请继续往下看。
2025-01-14 18:19:51
19887
43
原创 【超分辨率(Super-Resolution)】关于【超分辨率重建】专栏的相关说明,包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等
本专栏研究领域为【超分辨率重建】,涵盖图像超分、视频超分,实时超分,4K修复等方面。主要内容包括主流算法模型的论文精读、论文复现、毕业设计、涨点手段、调参技巧、论文写作、应用落地等方面。算法模型从SRCNN开始更新至今,一般是一篇论文精读对应一篇论文复现。论文精读详解理论,归化繁为简,归纳核心,积累词句,培养阅读论文和论文写作能力。论文复现依托Pytorch代码,实现完整的模型训练流程,总结调参方法,记录碰到的bug,论文插图可视化,培养读写代码能力、做实验的能力、以及应用落地能力。
2024-03-25 15:50:42
33605
55
原创 【图像拼接(Image Stitching)】关于【图像拼接论文源码精读】专栏的相关说明,包含专栏内文章结构说明、源码阅读顺序、培养代码能力、如何创新等。总之,【图像拼接源码】复现看这一篇就够了!
本文是【图像拼接论文源码精读】专栏的相关说明,将一些共性的东西在这里做统一说明,就不在每一篇文章中重复了。【图像拼接(Image Stitching)】关于【图像拼接论文精读】专栏的相关说明,包含专栏使用说明、创新思路分享等(不定期更新)。先看该专栏说明,然后进入专栏阅读相关文章,建议同步订阅,同步阅读。本专栏针对图像拼接领域公布源码的文章进行源码解读,没有源码的文章在有源码的文章全部更新完毕后尝试复现。
2024-01-01 10:01:56
27660
17
原创 【图像拼接(Image Stitching)】关于【图像拼接论文精读】专栏的相关说明,包含专栏使用方法、阅读顺序、创新思路、文章汇总、源码汇总、数据集汇总等。总之,【图像拼接论文相关】看这一篇就够了
为什么会有这篇文章?因为专栏简介里写不下太多东西,只能通过这篇文章和大家交流,算是一个专栏阅读指南吧。说点心里话本来吧,我只想用CSDN来记录自己学习【图像拼接】领域论文的过程,对每篇文章有个细致的理解,方便自己反复查阅。设置为付费也是因为涉及论文和本人其他项目需要,防止查重和其他问题,所以价格最开始设置的是专栏付费价格里最高的。起初,确实没有人看,一切也都平淡地度过着。
2023-11-30 15:36:46
42133
30
原创 TGRS 2026 即插即用 | Transformer篇 | CPDMA:中心像素引导双路径多头注意力, 打破传统方法维度建模单一局限!
本文介绍了一种用于高光谱图像分类的新型注意力模块——中心像素引导的双路径多头注意力(CP-DMA),其核心创新点包括: 中心像素引导的线性复杂度注意力:通过仅使用中心像素作为查询,大幅降低计算复杂度,从O(n²)降至O(n),使高分辨率高光谱数据的实时处理成为可能。 空间-光谱双路径联合建模:首次设计并行的空间和光谱注意力分支,通过逐元素相乘实现深度融合,解决了传统方法维度建模单一的问题。 双先验知识融合机制:引入高斯空间先验和衰减光谱先验,模拟高光谱图像的空间局部相关性和光谱相邻相关性,显著提升模型鲁棒性
2026-06-10 08:50:53
56
原创 TPAMI 2026 即插即用 | Transformer篇 | CCCA:零参数涨点神器!一行替换原生 MHA,过滤90%交叉注意力错误匹配,全局建模能力丝毫不减!
本文介绍了DC-SAM架构中的Cyclic Consistent Cross-Attention (CCCA)模块,该模块通过双一致性约束增强交叉注意力机制。CCCA的核心创新在于无参数循环一致性约束,可过滤90%以上的无效注意力权重,同时保持全局建模能力。该模块完全兼容PyTorch原生MHA接口,计算开销仅增加5%,却能显著提升模型性能。CCCA适用于所有使用交叉注意力的任务,可直接替换Transformer注意力层。实验表明,CCCA在视觉分割任务中实现了SOTA性能,并通过循环一致性机制带来明显涨点
2026-06-10 08:50:00
48
原创 CVPR 2026 即插即用 | Transformer篇 | SAA:密度驱动自适应聚合,只用3%的Token就媲美全局自注意力!还是O(n)复杂度!
SAT整体架构:Selective Aggregation Attention (SAA)为自注意力层。SAA示意图:密度驱动的自适应 token 聚合:首次提出基于局部密度 - 相对距离的聚类中心选择算法。局部密度 ρ:token 与周围 k 个最近邻的平均相似度,衡量 token 的代表性;相对距离 δ:token 到最近更高密度点的距离,衡量 token 的独特性;综合得分 γ=ρ×δ,同时兼顾代表性和独特性,选择最具信息量的 token 作为中心。
2026-06-08 09:22:40
182
原创 TGRS 2026 即插即用 | 注意力篇 | SCFM:双向交叉显著性引导注意力,高层语义与低层细节的双向互补!
本文介绍了MPCNet中的语义引导交叉注意力融合模块(SCFM),该模块通过双向交叉显著性引导机制实现跨尺度特征融合。SCFM创新性地结合了高层语义和低层细节的互补信息,通过轻量局部空间注意力预增强和坐标注意力全局融合引导,显著提升了红外小目标检测的精度。实验表明,SCFM在多个数据集上达到SOTA性能,同时保持轻量高效的计算特性,支持端侧设备部署。 SCFM的核心贡献包括: 双向交叉显著性引导机制,实现语义与细节的互补融合 轻量局部空间注意力预增强模块,计算量仅为传统方法的1/10 坐标注意力全局融合引导
2026-06-08 09:21:54
43
原创 TGRS 2026 即插即用 | 注意力篇 | GSFM:全局语义引导,四向全交互跨尺度建模融合,覆盖高低层所有特征依赖关系!
本文介绍了MPCNet中的全局语义感知融合模块(GSFM),该模块用于红外小目标检测任务中的跨尺度特征融合。GSFM通过统一小尺寸全局注意力(计算量降低98%)和四向全交互跨尺度注意力,实现了高效的特征融合。其核心创新包括:共享融合V特征设计、可学习残差权重+双残差连接,以及全局语义引导的精准融合。实验表明,GSFM在多个数据集上达到SOTA性能,能有效增强目标特征并抑制背景噪声。该模块适用于各种跨尺度特征融合任务,具有计算高效、训练稳定等优势。
2026-06-02 09:02:42
61
原创 TGRS 2026 即插即用 | 注意力篇 | MPM:多尺度+坐标注意力方向感知增强,精准捕捉结构特征,细节零丢失!
MPCNet整体架构以及模块Multi-scale Perception Module (MPM):MPM用在Encoder中。MPM架构:渐进式多尺度通道拆分设计:将输入特征在通道维度均分为 4 个分支,分别采用 3×3、5×5、7×7、7×7 的卷积核,渐进式覆盖从局部到全局的感受野。每个分支仅处理 1/4 通道,参数量仅为普通多分支卷积的 1/4,实现了 “多尺度覆盖、极低参数量”。
2026-06-02 09:01:57
47
原创 IF 2026 即插即用 | 注意力篇 | CHB:局部 - 多尺度 - 全局三级融合!解决传统模块上下文建模单一核心痛点!
文章摘要: EchoSR提出了一种高效的轻量级图像超分辨率框架,通过创新的三级上下文融合架构(局部-多尺度-全局)解决传统模块的局限性。其核心创新包括:多尺度深度卷积实现超大感受野(17×17)与低计算量;轻量全局上下文模块(GCE)以线性复杂度建模语义信息;特征分解FFN增强表达能力。实验表明,EchoSR在PSNR指标和推理速度(快2倍)上均优于现有方法,支持高分辨率实时处理,可直接替换现有网络模块。消融实验验证了各组件有效性,可视化结果展示了优异的细节重建能力。
2026-05-28 09:30:54
54
原创 TPAMI 2026 即插即用 | 注意力篇 | BIM:协方差全局感知注意力,噪声伪影全抑制、细节零丢失!
本文提出了一种基于人脑视觉机制的新型图像恢复模块BIM(Brain-Inspired Module)。该模块通过双分支多尺度编码(3×3和9×9深度卷积)模拟初级视觉皮层,采用协方差驱动的全局相似性感知机制增强特征一致性,并通过级联高阶特征交互实现复杂依赖关系建模。实验表明,BIM在图像去雾、超分辨率等多种底层视觉任务上均达到SOTA性能,同时保持轻量高效(计算量仅为Transformer的1/100)。该模块可直接替换现有网络中的卷积或注意力层,无需修改结构即可提升模型性能,特别适合高分辨率图像处理任务。
2026-05-28 09:30:07
38
原创 TIP 2025 即插即用 | 特征融合篇 | DAM:解耦注意力模块,双模态融合提升性能,适配各种特征融合任务!
文章摘要: SATNet提出了一种轻量级RGB-D显著性检测方法,通过解耦注意力模块(DAM)实现高效双模态融合。DAM采用双模态解耦设计,分别增强RGB与深度特征,通过跨模态引导和双策略融合(元素乘与通道最大)强化互补信息。实验表明,该模块在保持轻量级(5.2M参数)的同时达到415FPS,性能优于现有方法。DAM可广泛应用于双模态融合任务,消融实验验证了其有效性。核心创新包括独立模态增强、跨模态注意力引导及轻量化设计,显著提升了特征融合的精度与效率。
2026-05-26 09:30:21
39
原创 CVPR 2026 即插即用 | 特征提取篇 | LAO:局部注意力算子,像素密集特征上采样新范式,指标猛涨!
UPLiFT提出了一种高效的局部注意力上采样模块LAO,通过高分辨率引导特征生成局部邻域注意力权重,实现低复杂度、高精度的特征上采样。该模块摒弃传统QKV计算,采用预定义邻域偏移和1×1卷积生成权重,计算量仅为传统方法的1/10。LAO支持双模式内存适配,可处理4K/8K超分辨率图像,在分割和深度估计任务上达到SOTA性能,同时保持即插即用特性,可直接替换现有上采样模块。实验表明,LAO在细节保留和语义融合方面显著优于传统方法。
2026-05-26 09:29:45
260
原创 TIP 2025 即插即用 | 特征融合篇 | DFAM:全局-局部双信息引导+多尺度聚合,各种特征全覆盖!
本文提出了一种轻量级RGB-D显著性目标检测网络SATNet,其核心创新点是双特征聚合模块(DFAM)。DFAM通过全局-局部双信息引导机制和多尺度分解空洞卷积分支,实现了高效的特征融合与增强。该模块采用1×1卷积捕捉局部依赖,结合分解卷积与空洞卷积扩大感受野,并通过残差连接保留原始特征信息。实验表明,DFAM在保持轻量级(5.2M参数)的同时,性能优于传统方法(如ASPP),推理速度达415FPS。该模块适用于需要强化全局-局部协同与多尺度依赖的视觉任务,特别是双模态/双尺度融合场景。
2026-05-22 08:39:43
232
原创 ICCV 2025 即插即用 | 特征融合篇 | 幅值 - 相位频域解耦新范式!ARE分布对齐+PCM结构校正,性能优于各种注意力!
本文提出了一种基于频域的扩散模型FrDiff,用于非配对图像去雾。该模型包含两个核心模块:幅值残差编码器(ARE)和相位校正模块(PCM)。ARE通过全局统计分布对齐提取幅值残差特征,简化扩散模型的学习目标;PCM利用幅值残差引导相位校正,保留图像结构信息。实验表明,该方法在合成和真实数据集上均优于现有技术。ARE采用无参数设计实现高效幅值修正,PCM通过轻量化注意力机制优化相位恢复。消融实验验证了模块的有效性,性能对比显示其SOTA表现。该方案适用于频域敏感的特征融合任务,计算高效且物理可解释。
2026-05-22 08:39:08
179
原创 MICCAI 2025 即插即用 | 注意力篇 | PFESA:无参高低频解耦注意力,边缘结构增强,更轻更准!
本文提出了一种无参数边缘-结构注意力模块PFESA,用于医学图像分割任务。该模块通过自适应频域高斯滤波将输入特征解耦为高频边缘分量和低频结构分量,并分别设计专属的统计驱动注意力机制。核心创新包括:1)完全无参数设计,零训练负担;2)自适应频域高低频解耦;3)正交双注意力机制分别增强边缘和结构信息。实验表明,PFESA在Dice系数上比基线提升3.3%,且无需微调即可即插即用。模块通过频域分解、边缘/结构注意力计算、权重融合等步骤实现特征增强,适用于轻量级频域敏感的小样本任务。
2026-05-20 10:31:04
74
原创 TPAMI 2025 即插即用 | Transformer篇 | T-MSA:新范式!泰勒展开多头自注意力,O(n)复杂度实现全局建模!
MB-TaylorFormer V2提出了一种基于泰勒展开的线性注意力模块T-MSA,通过泰勒公式将传统Softmax注意力的二次复杂度降至线性。该模块采用双路径归一化和聚焦因子平衡效率与表达能力,结合多尺度卷积位置编码增强空间结构感知。实验表明,T-MSA在图像去雾、去雨等底层视觉任务上实现SOTA性能,计算量降低90%以上。模块支持即插即用,可直接替换Transformer中的自注意力层,无需修改网络结构,且全标准算子设计便于端侧部署。代码开源,适用于需要高效处理高分辨率图像的视觉任务。
2026-05-20 10:30:20
55
原创 ICCV 2025 即插即用 | Transformer篇 | LMLT:自底向上多尺度融合范式,全局建模更精准,局部细节不丢失!
本文提出了一种创新的Low-to-high Multi-Level Transformer (LMLT)模块,用于解决传统Transformer在图像超分辨率任务中的计算复杂度高、窗口边界问题和多尺度融合效率低等痛点。LMLT通过以下核心创新实现高效的多尺度特征融合:(1)采用自底向上的多尺度融合范式,先处理低分辨率语义特征再逐层引导高分辨率细节恢复;(2)通道拆分的无冗余多尺度设计,显著降低计算量;(3)引入局部增强位置编码的窗口自注意力,增强局部细节保留能力;(4)跨层级残差传递实现语义信息的高效流动。
2026-05-18 10:16:59
53
原创 TGRS 2026 即插即用 | 卷积篇 | CKConv:卷积的艺术!经纬交织双路径中国结卷积,全局结构+局部细节兼顾,轻量化实现大感受野!
"""文章摘要""" MSCK-Net提出了一种创新的中国结卷积网络(CKConv)用于红外舰船检测。该模型通过双路径设计(方向可分离卷积+局部深度卷积)实现特征增强,多分支并行架构覆盖3/5/7/9多尺度感受野。相比传统卷积,CKConv在保持轻量化的同时显著提升检测性能:参数量减少71-78%,在红外舰船数据集上达到SOTA效果。模型完全兼容标准卷积实现,支持端侧部署,为小目标检测提供了新的解决方案。
2026-05-18 10:16:27
170
原创 【图像超分】前沿资讯:CVPR 2026 | 第十一届NTIRE 2026高效超分辨率挑战赛报告,除了失望不知道该说什么,what can I say?
本文总结了2026年NTIRE高效超分辨率挑战赛的主要内容和参赛团队的技术方案。赛事目标是在保持PSNR性能(DIV2K_LSDIR_valid/test分别达到26.90/26.99 dB)的前提下,优化模型的计算效率指标(运行时间、参数和FLOPs)。Baseline采用SPAN架构,参数量0.151M,平均PSNR 26.94/27.01 dB,运行时间7.65ms。12支参赛团队通过注意力机制优化、CUDA内核融合、知识蒸馏、重参数化等技术改进模型效率。最终XiaomiMM团队凭借硬件层面的CUDA
2026-05-07 09:35:34
315
原创 【图像超分】前沿资讯:NTIRE 2026!CVPR 2026 Workshop挑战赛x4图像超分赛道报告!一大批CVPRW论文即将来袭!
本文介绍了NTIRE 2026超分辨率挑战赛(x4赛道)的技术报告,包含恢复赛道和感知赛道两个子赛道。赛事延续了去年的评估指标,允许使用额外数据集。参赛队伍主要采用基于Transformer的预训练模型,并创新性地结合两阶段管道、扩散模型等技术。三星团队凭借HAT+NAFNet的混合架构再次双赛道夺冠,其新增的几何先验和语义注入模块显著提升了感知质量。文章还分析了前6名团队的解决方案特点,指出传统恢复赛道注重双分支架构融合,而感知赛道更倾向采用最新生成技术。最后提供了相关专栏和交流群信息,为超分辨率研究者提
2026-05-07 09:34:57
119
原创 TGRS 2026 即插即用 | 注意力篇 | PSAA:小波动态增强+感知注意力,高频细节 + 全局上下文全保留!
PSAA模块是一种用于红外小目标检测的并行自注意力机制,通过解耦式双并行架构实现高频细节和全局上下文信息的联合增强。该模块包含小波动态注意力分支(WDE)和上下文感知注意力分支(CAA),分别处理高频细节和全局语义信息,并通过可学习参数自适应融合。相比传统注意力方法,PSAA在计算效率、细节保留和全局感知方面具有优势,在红外小目标检测任务中实现了SOTA性能。模块采用多级残差连接设计,支持灵活插入网络任意位置,适用于对高频细节和全局上下文要求较高的视觉任务。
2026-04-29 10:53:54
100
原创 TGRS 2026 即插即用 | 特征融合篇 | SSFRM:语义-空间双模态特征解耦,U型网络跳连融合新范式!
本文提出了一种用于遥感图像道路提取的CRNet网络,其核心创新是语义-空间特征提纯模块(SSFRM)。该模块通过解耦式双分支架构,分别从语义和空间维度对浅层特征进行引导修正,有效解决了传统特征融合中的语义鸿沟问题。关键创新包括分组式相似度计算机制降低计算复杂度,跨模态引导特征对齐缩小深浅特征差距。实验表明,SSFRM在几乎不增加计算量的情况下显著提升了道路提取精度,且兼容各类U型结构网络。模块采用轻量化设计,计算效率优于Transformer类方法,特别适合高分辨率遥感图像处理任务。
2026-04-29 10:52:40
69
原创 TGRS 2026 即插即用 | 注意力篇 | SFSDF:多尺度空域+多频率频域协同,局部细节+全局结构,全维度特征捕捉!
本文提出了一种创新的Spectral Frequency and Spatial-Domain Fusion (SFSDF)模块,通过多尺度空域分支和频域注意力分支的并行设计,实现了局部细节与全局结构特征的深度融合。该模块采用多光谱分组自注意力(SFGSA)机制,基于DCT变换预生成关键频率滤波器,仅提取16个最重要的高频分量,大幅提升了频域建模效率。同时通过1×1、3×3、5×5多尺度卷积捕捉不同粒度的空域特征,最后通过残差引导的双分支融合策略实现特征互补。实验表明,该模块在纹理丰富和结构敏感的任务中表现
2026-04-28 08:40:28
110
原创 CVPR 2026 即插即用 | Transformer篇 | DFRL:Hedgehog注意力媲美原生Softmax表达力,O(N)复杂度实现全局建模!
本文介绍了一种名为UCAN的轻量级超分辨率网络架构,其核心创新是Dual Fusion Receiver Layer (DFRL)模块。该模块通过Hedgehog注意力机制实现空间-通道双维度的全局建模,在保持线性复杂度的同时显著提升计算效率。关键技术包括:共享Q/K机制减少40%参数量、可学习傅里叶位置编码增强长序列建模、Hedgehog线性注意力优化表达性能。实验表明,在Manga109(4×)和BSDS100数据集上,UCAN以更少计算量(48.4G MACs)达到31.63dB和27.79dB的PS
2026-04-28 08:39:49
299
原创 TMM 2026 即插即用 | 注意力篇 | FDFAM:频域跨模态注意力,双向交互+全局建模,结构细节全保留!
本文提出了一种频域特征融合模块FDFAM,通过频域双向注意力机制和多尺度频域前馈网络实现红外与可见光双模态的精准融合。核心创新包括:频域跨模态双向注意力(MFCA)实现全局互补特征交互,多尺度频域前馈网络(FDFFN)捕捉不同尺度频域信息,以及频域-空域联合建模架构。实验表明该模块能有效提升检测性能,在多个数据集上达到SOTA效果。模块计算复杂度低,适用于高分辨率图像的实时融合任务。
2026-04-25 09:55:30
59
原创 TMM 2026 即插即用 | 注意力篇 | LFEM:四分支卷积互补并行架构,覆盖局部细节到全局上下文全维度特征捕捉!
本文提出了一种即插即用的局部特征增强模块(LFEM),通过四个互补的卷积分支(标准3×3卷积、空洞卷积、可变形卷积V2和深度可分离卷积)来增强初始特征。该模块利用通道混洗实现跨分支特征交互,并通过残差连接保持输入输出尺寸一致。LFEM能够有效捕捉多尺度、形变目标的特征,在极低参数量下提升特征表达能力,适用于复杂视觉任务。实验表明,该模块在可见光红外目标检测等任务中性能优越,且无需修改网络结构即可直接替换普通卷积块,具有广泛适用性。
2026-04-25 09:54:41
72
原创 TMM 2026 即插即用 | 注意力篇 | CGMM:双向跨模态交互特征增强,全局建模对齐多模态特征融合!
文章摘要: FreDFT提出了一种频域融合Transformer用于可见光-红外目标检测,核心创新是跨模态全局建模模块(CGMM)。该模块采用双向对称架构实现红外与可见光特征的互补增强,通过通道-空间联合建模机制同步提升两个模态的特征质量。关键技术包括双池化全局统计特征融合和轻量化设计,计算复杂度仅为O(C⋅HW),比传统注意力降低2个数量级。实验表明,CGMM能有效增强特征表达,在多个数据集上达到SOTA性能。模块采用即插即用设计,支持1×1卷积、全局池化等基础操作,可直接嵌入现有双模态编码器。代码已开源
2026-04-23 11:31:00
58
原创 TMM 2026 即插即用 | 注意力篇 | CAI:边缘先验+双向交叉注意力+可逆特征变换,解决多模态融合痛点!
本文提出了一种新颖的Cross Attention and Invertible Block (CAI)模块,用于红外-可见光图像融合任务。该模块通过双向交叉注意力机制实现双模态特征的互补增强,结合边缘感知的特征提取和可逆变换实现无损特征融合。CAI模块包含三个核心创新点:(1)双向交叉引导的跨模态注意力机制,解决模态失衡问题;(2)边缘感知的基础特征提取设计,保证结构完整性;(3)仿射变换驱动的可逆无损特征增强,避免信息丢失。实验表明,该模块在融合效果和下游任务性能上均达到SOTA水平,同时具有轻量化优势
2026-04-23 11:30:28
64
原创 CVPR 2026 即插即用 | 注意力篇 | MSEF:超轻注意力,空间-通道双分支并行融合,既增强特征又抑制噪声!
Multinex提出了一种超轻量级微光图像增强框架,其核心创新是MSEF模块。MSEF采用双分支并行架构,结合空间局部特征(深度可分离卷积)和全局通道注意力(改进SE),通过Tanh激活实现特征增强与抑制。相比传统注意力模块,MSEF在几乎不增加计算量的情况下显著提升性能,特别适合轻量级网络和边缘设备部署。实验表明,该模块能有效提升PSNR约3dB,同时保持极低的参数量(0.7K-45K)。
2026-04-20 10:42:46
479
原创 CVPR 2026 即插即用 | Transformer篇 | UPT:不确定性先验引导,水平-垂直双分支解耦注意力,全局建模新范式!
本文提出了一种用于显示器下相机(UDC)图像恢复的轻量级不确定性感知上下文记忆网络UCMNet。针对UDC成像中复杂的空间退化问题,该网络创新性地设计了不确定性先验驱动的双记忆银行机制,通过方差估计器生成不确定性图,自适应匹配不同退化模式。核心模块UPT采用水平-垂直解耦的轻量化注意力,在低分辨率空间实现高效全局建模,并通过高低分辨率分治架构优化细节恢复。实验表明,UCMNet在多个基准测试中实现了最先进的性能,参数量比现有模型减少30%,尤其擅长处理模糊、噪声等高不确定性退化区域,显著提升了图像恢复的精度
2026-04-20 10:42:14
135
原创 ICME 2026 即插即用 | 注意力篇 | SFD:显著特征判别器,全局通道关联建模,从本质区分显著目标与背景噪声!
本文提出了一种新颖的显著特征判别器(SFD)模块,用于光学遥感图像显著目标检测。SFD通过通道间成对差异计算生成判别矩阵,量化通道间差异程度,从而强化显著通道并抑制背景通道。该模块具有以下创新点:首创通道间判别式增强机制、支持领域先验融合、采用轻量化1×1卷积架构、与SFC模块形成"判别-校准"流水线、具备全局通道关联建模能力。实验表明,SFD模块在多个公开基准上实现了最先进的性能,显著提升了显著目标检测的精度和效率。该模块可广泛应用于需要特征增强的视觉任务,尤其适用于复杂背景下的目标检
2026-04-19 12:36:17
84
原创 ICME 2026 即插即用 | 注意力篇 | SFC:显著特征自适应加权,通道 - 空间联合校准,特征显著增强!
文章摘要: 本文提出了一种显著特征校准器(SFC)模块,通过双分支多尺度特征提取和通道-空间联合校准机制,有效增强显著目标特征。SFC采用3×3局部卷积和5×5空洞卷积的双分支结构,结合创新的通道-空间协同注意力机制,在极低参数量下显著提升特征信噪比。实验表明,该模块在遥感显著目标检测任务中实现SOTA性能,能自适应强化不同尺度目标,抑制背景噪声,且具有即插即用特性。模块核心包含多尺度特征提取、联合权重计算等6个步骤,代码开源并提供技术交流群(VX:shixiaodayyds)。
2026-04-19 12:35:35
96
原创 CVPR 2026 即插即用 | 注意力篇 | CmDRM:多模态融合创新!差分增强注意力,信息互补,结构细节全捕捉!
本文介绍了VideoFusion模型中的跨模态差分增强模块(CmDRM),该模块通过自适应学习模态级全局权重,结合通道-空间注意力机制,有效解决了多模态视频融合中的模态失衡、信息丢失和特征冲突问题。CmDRM采用轻量化全卷积设计,包含模态级差分权重学习、通道注意力增强和空间注意力增强三个核心步骤,在保持低计算量的同时显著提升了融合效果。实验表明,该模块能有效强化红外和可见光模态间的互补信息,抑制冗余干扰,在视频融合任务中取得了SOTA性能。
2026-04-16 08:53:31
130
原创 CVPR 2026 即插即用 | Transformer篇 | CMGF:多模态融合创新模块!双向跨模态Transformer,适配全场景!
本文提出了一种创新的多模态视频融合模块CMGF,其核心创新点包括:1)首创双向模态引导的双路交叉Transformer架构,通过公共Query+双路KV结构实现红外与可见光的互补增强;2)采用通道级高效交叉注意力设计,将计算复杂度从O((HW)²)降至O(C²);3)轻量化QKV生成模块结合深度可分离卷积,保留空间细节;4)预归一化双残差Transformer块保证训练稳定性。该模块可无缝嵌入各类多模态网络,在保留红外热目标结构信息的同时融合可见光纹理细节,解决了传统方法的信息丢失和模态偏差问题。实验表明,
2026-04-16 08:52:57
132
原创 CVPR 2026 即插即用 | Transformer篇 | AFFN:自相关前馈网络,基于频域建模的图像周期结构增强新范式,替换传统FFN涨点!
摘要:本文介绍了Flickerformer中的核心模块AFFN(自相关前馈网络),该模块通过FFT快速计算局部特征的自相关功率谱,在频域和空域双分支实现自相关增强。AFFN创新性地解决了传统自相关建模复杂度高、不可微的问题,同时结合深度卷积门控融合,实现全局周期结构与局部细节的协同增强。实验表明,AFFN在保持计算效率的同时,显著提升了模型对纹理和结构的感知能力,在多个视觉任务中达到SOTA性能。模块设计轻量化,可直接替换Transformer的前馈网络,具有即插即用的特性。
2026-04-15 07:55:58
634
原创 CVPR 2026 即插即用 | Transformer篇 | WDAM:小波解耦+方向注意力,高频细节+全局结构全保留!
Flickerformer提出了一种基于小波的定向注意力模块(WDAM),用于消除闪烁伪影。该模块通过Haar小波变换将输入特征解耦为低频结构分量和三个方向的高频细节分量,利用方向高频特征生成引导权重,强化对边缘纹理区域的注意力聚焦。采用移位窗口注意力实现低频结构的全局建模,同时优化高频细节分量,最终通过逆小波变换重建增强特征。WDAM创新性地实现了结构-方向解耦建模、方向引导注意力机制、全局-局部平衡设计,在保持低计算量的同时,有效解决了传统方法结构-细节混叠建模的缺陷。实验表明,该模块在性能和视觉效果上
2026-04-15 07:55:36
629
原创 TGRS 2026 即插即用 | 注意力篇 | HEWL:小波上采样,通道-空间-频域交互联合高频增强,细节全保留!
【摘要】本文提出了一种用于红外小目标检测的高频增强小波层HEWL,通过离散小波变换特性增强深度语义表示。HEWL创新性地将编码器跳连特征分解为低频和高频分量,采用交替通道-空间联合注意力(ALCA)针对性增强高频细节,并通过逆小波变换实现高质量上采样。实验表明,该模块能有效解决传统上采样导致的细节丢失问题,在多个数据集上达到SOTA性能。模块支持即插即用,适用于对频域敏感的小目标检测任务,尤其适合U型结构的Decoder部分。代码已开源,包含可微DWT/IDWT实现和残差特征增强机制。
2026-04-13 10:16:54
94
图像超分辨率WDSR的Pytorch复现代码,注释详细,含科研绘图,最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-04-30
图像超分辨率RDN的Pytorch版本复现代码,注释详细,易读易复用,含最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-04-28
Python实现多图像转换成连贯的PDF文件,支持所有图片格式,可预览、裁剪、自定义PDF布局、设置图像顺序、PDF质量选择等
2024-04-28
PPT绘制超分辨率论文中网络结构图,多种模板可供选择,包括3D立体效果的网络结构、2D平面结构以及相关组件的绘制
2024-08-12
一步到位绘制计算机视觉领域的局部放大图,对比各模型的可视化效果,可多图实时查看局部放大区域对比,点击鼠标即可同时裁剪并保存局部放大区域!
2025-05-16
图像拼接论文Seam-guided local alignment and stitching for large parallax images源码,跑通+注释
2025-02-27
图像超分专栏内文章单篇购买:图像超分论文复现:Pytorch实现WDSR!保姆级复现教程!代码注释详尽!完整代码和x2、x3、x4下的最优模型权重文件可以直接用!绘制论文曲线图!计算主流测试集的
2025-02-19
图像去噪Self2Self(S2S)的Pytorch复现代码,跑通代码,原理详解,代码实现、网络结构、论文公式相互对应,注释清晰
2024-12-06
图像去噪ECNDNet的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接使用,训练自己的数据
2024-09-19
图像去噪Noise2Void(N2V)的Pytorch复现代码,基于U-Net模型实现,原理详解,注释详细,包含训练好的模型
2024-09-10
图像去噪RNAN的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接使用,训练自己的数据集
2024-09-07
图像去噪Noise2Noise的Pytorch复现代码,基于REDNet30模型实现,N2N原理详解,注释详细,包含训练好的模型
2024-09-06
图像去噪IRCNN的Pytorch极简复现代码,包含计算PSNR/SSIM以及训练好的模型文件,可以直接使用,训练自己的数据集
2024-08-30
图像去噪MWCNN的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接使用,训练自己的数据集
2024-08-29
图像去噪MemNet的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接使用,训练自己的数据集
2024-08-25
图像去噪REDNet的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接使用,训练自己的数据集
2024-08-24
图像去噪RIDNet的Pytorch复现代码,包含计算PSNR/SSIM代码以及训练好的模型文件,可以直接用于真实图像去噪
2024-08-20
图像去噪DnCNN的Pytorch完复现代码,源码基础上添加DnCNN-B/CDnCNN-B、DnCNN-3的训练和测试复现
2024-08-12
图像超分辨率RCAN的Pytorch复现代码,科研绘图,指标计算,最优SSIM和PSNR的模型权重文件(x2、x3、x4、x8)
2024-05-22
图像超分辨率FSRCNN的最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-05-16
图像超分辨率SRCNN的Pytorch复现代码,注释详细,含科研绘图,最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-05-14
图像超分辨率ARCNN的Pytorch复现代码,注释详细,含科研绘图,各Quality下的最优SSIM和PSNR的模型权重文件
2024-05-13
图像超分辨率IDN的Pytorch复现代码,注释详细,含科研绘图,最优SSIM和PSNR的模型权重文件(x2、x3、x4)
2024-05-08
如何识别区分工件正反面?
2023-03-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅