Hack Hui
***添加微信公众号【CV Hack Hui】,发送【联系方式】。博主是985计算机博士,研究方向:计算机视觉、图像处理、目标检测、图像分割等!***发表多篇CCF顶会顶刊论文以及发明专利,担任多家包括ECCV\CVPR等审稿人! ***如果有考研申博、科研辅导、代码调试、更换数据集、指标计算等!***可以提供一对一高效辅导,可以找到我哦!群里都是志同道合的小伙伴,说不定就可以解决你的问题呢!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【即插即用完整代码】TPAMI26 2024“残差引导,一键修复” 让图像实现新生!
本文提出DA-RCOT方法,将一体化图像修复建模为最优传输问题。通过引入传输残差作为退化语义的载体,并设计两阶段多尺度残差条件化机制,模型能够同时处理噪声、模糊、雨痕等多种退化类型,在保持图像结构的同时实现高质量修复。原创 2026-04-01 17:30:00 · 591 阅读 · 0 评论 -
【即插即用完整代码】2025最新线性注意力,用于预训练图像和视频恢复模型
本文提出了一种即插即用的Nyström基线性自注意力近似方法PnP-Nystra,可无缝集成到预训练的图像/视频恢复模型中。该方法通过广义Nyström近似将自注意力的二次复杂度降低为线性,在SwinIR、Uformer等模型上实现2-5倍加速,PSNR损失小于1.5dB。实验表明,PnP-Nystra在不同恢复任务中均保持较高性能,是首个无需微调的自注意力替代方案,为资源受限场景提供了高效推理方案。原创 2025-07-22 16:33:39 · 129 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2026 “动态世界,检测无界” 让我们一起来无痕学新知吧!
真实世界的目标检测系统需要持续学习新类别、适应不同环境(如白天→黑夜→雾天),并识别未知物体,且不能依赖存储旧数据。为此,论文提出 EW-DETR 框架,通过增量低秩适配器、查询归一化物体适配器和熵感知未知混合三个模块,在无样例回放条件下同时解决遗忘、域迁移和开放世界检测三大难题。实验表明,EW-DETR在多项基准上显著优于现有方法,综合指标 FOGS 提升超过57%。原创 2026-05-07 17:30:00 · 323 阅读 · 0 评论 -
【即插即用完整代码】顶会新思路+1!Agent 玩转 Photoshop!!!
平面设计在广告、电商等领域至关重要,但专业设计软件操作复杂,非专业人士难以快速上手。现有自动设计方法要么只能生成不可编辑的图片,要么简化了真实设计流程,灵活性和直观性不足。本文提出 PDSdesigner——一个模拟人类设计师工作流程的自动化平面设计系统。该系统首先根据用户指令收集相关素材,然后通过“规划—插入—识别不足—优化”的迭代过程,逐步将素材整合成可编辑的 PSD 格式设计文件。为了让模型学会这种专业操作,团队还构建了首个包含操作轨迹的 PSD 设计数据集 CreativePSD。原创 2026-05-20 17:30:00 · 344 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2025简单且高效的FFT频域前馈网络EDFFN,可直接替换传统FFN层!
本文提出了一种高效的图像去模糊方法EVSSM,结合状态空间模型(SSMs)优势,通过视觉扫描块(EVS)和频域前馈网络(EDFFN)实现高性能去模糊。EVS利用几何变换捕获非局部信息,EDFFN通过频域筛选降低计算成本。实验表明,该方法在GoPro、HIDE和RealBlur等数据集上PSNR和SSIM指标均优于现有技术,且计算成本仅为同类方法的1/4。该研究为图像恢复任务提供了新的高效解决方案。原创 2025-06-25 22:38:36 · 404 阅读 · 0 评论 -
【即插即用完整代码】ICCV 2025 “风雨无阻立体眼,零样本稳抗风雨“
恶劣天气(如雨、雾、雪)会严重降低立体匹配模型的精度,主要原因是缺乏对应的训练数据,且模型难以从模糊、反光的图像中提取稳定特征。本文提出RobuSTereo框架,分为两步解决该问题:第一,利用扩散模型和一致性模块,自动生成大量高质量、结构对齐的恶劣天气立体图像对;第二,设计一种鲁棒特征编码器,结合卷积网络与去噪Transformer,在低能见度条件下稳定提取特征。实验表明,该方法在多个恶劣天气数据集上显著提升了零样本立体匹配的准确性和鲁棒性。原创 2026-04-21 17:30:00 · 362 阅读 · 0 评论 -
【即插即用完整代码】AAAI 2026 “一看就懂,先扫后察”大模型让视频异常无处遁形!
本文提出了VAGU——首个同时支持异常定位与异常理解的视频异常检测基准数据集。VAGU包含7,567个真实场景异常视频,覆盖21个异常类别,并提供了2万余组异常相关的问答对。在此基础上,作者进一步提出了GtS(Glance then Scrutinize) 框架,这是一种无需训练的方法。它通过“静态+动态”文本引导,先粗略定位高概率异常片段,再进行细粒度的异常理解与时间边界精修。此外,论文还设计了JeAUG评估指标,能够联合评价模型的语义理解能力和时间定位精度。原创 2026-05-22 17:30:00 · 341 阅读 · 0 评论 -
【即插即用】CVPR‘2025 清华团队“看全局,盯细节”,发布全新视觉轻量级架构LSNet
摘要:本文提出LSNet轻量级视觉网络,模拟人类视觉系统的"SeeLarge,FocusSmall"机制,通过创新的LS卷积(大核感知LKP和小核聚合SKA)实现高效视觉处理。LSNet在ImageNet分类(80.3% top-1)、COCO检测(AP 39.2)和ADE20K分割(mIoU 43.0)等任务中表现优异,同时保持低计算量(最小0.3GFLOPs)。实验证明该方法在性能与效率间取得平衡,代码已开源,适用于多种CV任务。原创 2025-08-04 15:10:49 · 152 阅读 · 0 评论 -
【即插即用】CVPR 2025最新轻量级视觉骨干网络LSNet,无痛涨点,可替换其他Backbone!
【即插即用】CVPR 2025最新轻本文提出了一种受人类视觉系统启发的轻量级视觉网络LSNet,采用见大聚焦小"策略,结合大核感知(LKP)和小核聚合(SKA)的LS卷积操作,实现了高效视觉信息处理。实验表明,LSNet在ImageNet分类(80.3%准确率)、COCO检测(34.2 AP)和ADE20K分割(40.1 mIoU)等任务中表现优异,且具有更好的鲁棒性(mCE 59.3)。该网络通过模块化设计平衡性能与效率,为轻量级视觉模型提供了新思路。代码已开源,适用于多种CV任务。原创 2025-07-15 14:49:31 · 312 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2026“用视觉修复视觉” 反向追踪图像瑕疵
本文提出一种名为Defusion的全新图像修复框架。它用“视觉指令”代替文字来描述图像退化,并引导扩散模型在退化空间中去噪修复。实验证明,该方法用一个模型就能处理多种退化任务,效果超越现有最先进方法。原创 2026-04-16 17:30:00 · 1126 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2026“乱中有序”这才是修图届的洗牌高手!
本文提出一种名为DFPIR的全能图像恢复框架,旨在解决统一模型处理多种图像退化时的任务干扰问题。通过引入退化感知特征扰动机制,从通道和注意力两个维度对特征空间进行动态调整:通道维度采用退化引导的通道打乱策略,注意力维度通过选择性掩码丢弃部分注意力响应。该机制在保留图像固有特征的同时,有效减少不同退化类型之间的相互影响。实验结果表明,DFPIR在去噪、去雾、去雨、去模糊和低光增强等多个任务上均达到当前最优性能。原创 2026-04-14 17:30:00 · 22 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2022 “一修了之 万图更新” 来看看全能图像净化器吧!
AirNet是一种面向未知退化的全能图像恢复网络,旨在解决真实场景中图像退化类型与程度未知且多变的问题。该方法由对比式退化编码器和退化引导恢复网络两部分构成,能够在无需预先知道退化类型与程度的情况下,使用单一网络同时处理噪声、雨痕和雾霾等多种退化。实验结果表明,AirNet在多个公开数据集上超越了17种基线方法,实现了更优的图像恢复性能。原创 2026-04-09 17:30:00 · 21 阅读 · 0 评论 -
【即插即用完整代码】NeurIPS 2023 “盲修大师:提示驱动 ”万物皆可修!
现有的图像恢复方法通常只能处理单一类型的图像退化,且需要事先知道退化类型才能选择合适的模型,这限制了它们在真实场景中的应用。为此,本文提出了PromptIR——一种基于提示学习的全能盲图像恢复框架。PromptIR通过一个轻量级的即插即用提示模块,动态生成与输入图像退化类型相关的提示信息,并利用这些提示引导恢复网络自适应地去除噪声、雨纹或雾霾等不同退化。实验结果表明,PromptIR在去噪、去雨和去雾任务上均达到了当前最优性能,平均PSNR比此前的最佳方法提升0.86dB,同时展现出更强的泛化能力和参数效率原创 2026-04-03 18:00:00 · 21 阅读 · 0 评论 -
【即插即用完整代码】TPAMI 2025 “语言引导,画质重生”让AI读懂你的照片!
VLMIr:用语言引导图像修复传统图像修复只关注像素,忽视了语义。本文提出的VLMIr框架,首次将视觉语言模型的双重先验——视觉特征与文本描述——引入图像修复。通过对比学习和交叉注意力机制,让模型在恢复图像时既能看细节,又能懂内容。在雨滴去除、去雾、去噪三个任务上,VLMIr的PSNR、SSIM、LPIPS等指标均超越现有方法。视觉与语言,缺一不可。原创 2026-03-25 17:30:00 · 24 阅读 · 0 评论 -
【即插即用完整代码】2025 TIP ReviveDiff:让坏天气拍出好照片
本文提出的 ReviveDiff 是一个基于扩散模型的通用图像修复框架,它从宏观与微观两个层面恢复图像质量,核心创新包括:粗到细学习模块:同时捕捉全局结构和局部细节;多注意力特征互补模块:自适应融合不同尺度特征;边缘与直方图先验损失:确保结构清晰、色彩真实;在七个公开数据集上的实验表明,ReviveDiff 在 PSNR、SSIM、LPIPS 等指标上全面超越现有最先进方法,且计算量原创 2026-03-24 19:54:33 · 29 阅读 · 0 评论 -
【即插即用完整代码】2026 ICML “你的融合算法,敢挑战这种“地狱难度”吗?”
本论文主要解决的是在复杂环境下,比如有噪声、模糊、雾霾的红外和可见光图像,如何进行高质量的融合。作者提出了一个名为TG-ECNet的统一框架,并构建了一个大规模的数据集,在多项任务上都取得了当前最好的效果。原创 2026-03-23 15:34:22 · 27 阅读 · 0 评论 -
【即插即用完整代码】2026 AAAI “语言作向导,融合更智能”,让AI也能因天制宜!
该研究针对红外与可见光图像融合在恶劣天气下面临的性能下降问题,提出了一种名为MdaIF的一站式解决方案。该方法通过引入大语言模型提取图像的语义先验信息,并结合混合专家系统与通道注意力机制,实现了对雾、雨、雪等多种退化场景的自适应融合。实验证明,该方法在多个基准数据集上均取得了优于现有技术的融合效果。原创 2026-03-20 17:30:00 · 292 阅读 · 0 评论 -
【即插即用完整代码】2026 TPAMI “别卷了,提示!”“图像修复好了”
本文针对全合一图像修复中提示学习的核心矛盾——自适应提示存在冗余,显式提示丢失细节——提出对比提示学习框架。通过稀疏提示模块减少表示冗余,结合对比提示正则化强化任务边界,直接优化提示与模型的交互。实验表明,该方法在五个基准上持续提升现有模型性能,达到领先水平。原创 2026-03-19 17:30:00 · 28 阅读 · 0 评论 -
【即插即用完整代码】AAAI 2026 CVPR all in on 图像处理重磅来袭!
本文提出了一种新颖的频率条带注意力(FSA)模块,通过在频率域中分解方向性频率条带来构建注意力机制。该模块将特征图通过傅里叶变换映射到频率域,分解为水平、垂直等方向的频率条带,并为每个条带生成自适应权重。实验表明,FSA在细粒度分类、目标检测等任务上显著提升了性能,且计算开销极小。该方法为注意力机制提供了新的频率域视角,具有通用性和高效性。原创 2026-03-18 17:30:00 · 352 阅读 · 0 评论 -
【即插即用完整代码】CVPR 2026新方法归一化空间与通道注意力,无额外参数,轻量且高效,超越CBAM,快速涨点,发表论文!
【即插即用完整代码】新方法归一化空间与通道注意力,无额外参数,轻量且高效,超越CBAM,快速涨点,发表论文!原创 2026-03-17 19:16:10 · 309 阅读 · 0 评论
分享