清风AI
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【2025CVPR-密集检测】
本文提出TIDE(文本到图像与密集标注统一生成模型),创新性地实现仅通过文本输入同时生成水下图像及多类型密集标注(深度图、语义掩码)。核心贡献包括:1)首创统一生成框架,通过隐式布局共享机制(ILS)和时间自适应归一化(TAN)确保多模态输出一致性;2)构建14K真实数据四元组及5万样本合成数据集SynTIDE;3)实验表明模型在深度估计(SIlog指标提升14.7%)和语义分割(mIoU提升2.1%)任务中显著提升性能,并具备零样本生成能力。该研究为水下视觉任务提供了高效数据合成方案,论文代码已开源。原创 2025-10-17 08:30:00 · 213 阅读 · 0 评论 -
PANet: Pluralistic Attention Network for Few-Shot Image Classification一种基于注意力机制的少样本图片分类模型
摘要: PANet提出了一种基于多元化注意力机制的少样本学习方法,通过局部编码内部注意力(LEIA)和全局编码互惠注意力(GERA)模块协同增强特征表示。LEIA结合空间与通道注意力提取局部特征,GERA利用样本间相关性优化全局特征,并设计双中心化(DC)余弦相似度提升度量鲁棒性。实验在miniImageNet等四个数据集上达到SOTA性能(如5-way1-shot准确率69.60%),消融实验验证各模块有效性。可视化显示PANet能精准定位目标区域并生成紧凑特征分布,为少样本学习提供了新思路。原创 2025-09-10 20:09:21 · 240 阅读 · 0 评论 -
LSAGNet:用于图像超分辨率的轻量级自注意力引导网络
本文提出轻量级自注意力引导网络LSAGNet,用于高效单图像超分辨率。针对现有方法局部连续性缺失或全局建模不足的问题,设计残差混合变换器组结合动态局部注意力(DLA)和全局自注意力(GSA),DLA通过动态卷积核增强局部特征,GSA利用软阈值优化全局相关性。采用重参数化卷积减少计算量,结合频域损失提升重建质量。实验表明,该模型仅553K参数量,在Urban100(×4)达到32.92dB PSNR,计算量较同类降低38%,实现了性能与效率的平衡。原创 2025-09-08 21:38:31 · 114 阅读 · 0 评论 -
【2025ICCV】 Vector Contrastive Learning For Pixel-Wise Pretraining In Medical Vision
医学图像因解剖结构一致性导致全局多样性不足,传统对比学习易收敛至平凡解。本文提出向量对比学习(VectorCL),将特征距离建模转化为位移向量回归,解决像素级预训练的过离散问题。创新COVER框架包含:1)自向量回归(SeVR)通过空间变换生成监督信号;2)向量混合(MoV)保留空间连续性;3)向量金字塔聚合(VPA)实现多尺度建模。在8个2D/3D医学任务上验证,平均DSC达84.5%,显著优于现有方法,尤其在细粒度结构分割中提升4.5%。COVER首次实现特征空间连续且类内聚集,为医学图像分析提供新范式原创 2025-09-03 15:38:56 · 78 阅读 · 0 评论 -
【2025ICCV】Vision Transformers 最新研究成果
EA-ViT提出一种高效弹性视觉Transformer适配框架,通过多维弹性架构(MLP扩展率、注意力头数、嵌入维度和深度)和课程式训练策略,实现单次训练覆盖全算力谱系。创新性地结合改进NSGA-II搜索Pareto最优子模型,并设计轻量级路由器动态适配任务需求。实验表明,在12+数据集上相比现有方法最高提升26.39%精度,同时减少90%训练成本,为异构设备部署提供高效解决方案。原创 2025-09-01 22:58:34 · 580 阅读 · 0 评论 -
MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmen
本文提出轻量级3D医学图像分割模型MLRU++,通过LCBAM轻量注意力模块(参数减少50%)和M²B多尺度瓶颈块,在降低计算开销的同时提升小器官分割精度。实验表明,模型在Synapse等四大数据集上达到SOTA(Dice 87.57%),参数量仅46.09M,显著优于UNETR++等基线模型。消融验证证实M²B模块贡献1.21%性能提升,尤其改善了胆囊等小器官的分割效果(边界精度HD95降至7.53mm)。该工作为资源受限场景提供了高效的3D医学图像分割解决方案。原创 2025-08-27 21:47:32 · 241 阅读 · 0 评论 -
iTransformer:倒置Transformer结构在时间序列预测中的高效性
《iTransformer:时序预测的维度重构方法》针对传统Transformer在多变量时序预测中的局限性(忽略变量差异、计算复杂度高等),提出创新架构:将变量维度作为注意力机制的作用域,时间维度交由前馈网络处理。该方法在7个数据集上平均MSE提升8.2%,高维数据表现尤为突出(如交通数据MSE降低35.6%),并展现优秀的变量泛化能力和长序列处理优势。实验验证其通用性(可适配多种Transformer变体)和可解释性,同时通过动态采样策略降低70%内存消耗。该工作为时序预测提供了新的基础架构范式。原创 2025-08-16 13:58:27 · 257 阅读 · 0 评论 -
[2025CVPR]STAtten:脉冲时空注意力Transformer
本文提出脉冲时空注意力Transformer(STAtten),解决脉冲神经网络中时空注意力计算效率低的问题。通过分块计算机制(降低1.6倍内存)和无Softmax设计,在CIFAR100-DVS上达到83.9%准确率(提升1.0%)。分析表明时空融合使注意力熵值降低19%,特征表征更高效。实验证明该方法在无人机视觉(延迟<8ms)和脑机接口(误报率降32%)中具有应用潜力,且不增加额外能耗(21.46mJ)。代码和预训练模型已开源。原创 2025-07-11 16:33:01 · 319 阅读 · 0 评论 -
[2025CVPR]Mr. DETR:检测Transformer的多路由指导训练解析
本文提出了一种创新的多路由训练框架Mr.DETR,用于解决DETR系列模型训练收敛慢的问题。该方法包含主路由(一对一)和两个辅助路由(一对多),通过指导性自注意力机制引入可学习指令token来引导查询。实验表明,该方法在12轮训练内即可达到SOTA性能,COCO数据集上mAP提升2.5%,同时保持推理效率(辅助路由仅训练时使用)。该框架可扩展到实例分割等任务,在无人机跟踪、工业质检等场景展现出应用价值。核心优势在于显著加速训练收敛(提升2倍)且不增加推理开销,代码已开源供复现使用。原创 2025-07-09 23:55:30 · 388 阅读 · 0 评论 -
基于IDIG-GAN的小样本电机轴承故障诊断
文章摘要:针对工业轴承小样本故障诊断难题,本文提出IDIG-GAN模型:①采用梯度归一化技术(计算量降低40%)严格满足1-Lipschitz条件;②创新梯度间隙正则化机制(λ=100)平衡判别器对真实/生成样本的梯度差异;③嵌入自注意力模块增强时频特征提取。实验表明,在CWRU数据集上生成样本的MMD降低6.3%,故障识别准确率提升至95.5%(较基线+2.5%),尤其球故障识别率提升7.2%。该模型仅需每类60样本即可实现高效诊断,生成推理耗时<5ms,适用于实时工业监测场景。原创 2025-06-06 22:48:34 · 842 阅读 · 0 评论 -
MPNet:旋转机械轻量化故障诊断模型详解python代码复现
多分支空洞融合:σ(F2);σ(F3);σ(F4);σ(ga(X))]平衡局部细节与全局特征无降维注意力:自适应卷积核保持通道信息完整性金字塔残差学习:多尺度特征残差传递提升梯度流轻量级设计:参数量仅1.71M,比ResNet18减少85%原创 2025-06-05 23:11:06 · 510 阅读 · 0 评论 -
YOLOV8涨点技巧之DSS模块(一种轻量化火灾检测模型)
DSS-YOLO通过三大创新模块的有机结合,在保持YOLO系列实时性的基础上,实现了对小目标和遮挡目标的精准检测。实验证明其mAP50达到89.5%,同时模型体积减少3.3%,为边缘计算设备的部署提供了新的解决方案。该技术已成功应用于多个智慧园区项目,平均预警响应时间缩短至3.2秒,标志着计算机视觉在公共安全领域的重要突破。原创 2025-05-25 19:31:51 · 248 阅读 · 0 评论 -
YOLOV8涨点技巧之空间通道协作注意力(SCCA)-应用于自动驾驶领域
SCCA-YOLO通过创新的空间-通道协作注意力机制,在保持YOLO系列实时性优势的同时,显著提升了高速公路场景下的检测性能。实验表明该模型在自建数据集上的mAP@0.5达到84.4%,较基准模型提升0.7个百分点,同时通过Ghost模块实现33%的参数量压缩。相关代码已开源,为自动驾驶感知系统提供了新的技术选择。原创 2025-05-25 19:09:16 · 318 阅读 · 0 评论 -
基于多头注意力时间卷积网络(MATCN)的虚拟电厂短期功率预测模型
时空特征解耦:TCN负责时间模式,注意力捕捉空间关联动态门控机制:自适应调整两种特征的融合比例多尺度感知:膨胀卷积覆盖5分钟到24小时的时间跨度轻量化设计:参数量比传统Transformer减少52%原创 2025-05-25 14:54:00 · 290 阅读 · 0 评论 -
基于动态注意力机制与双向融合的目标检测模型详解
动态注意力机制:首次在检测头中融合多维度注意力,实现小目标增强。双向加权特征融合:改进传统FPN的单向限制,提升遮挡目标识别。轻量化设计:在提升精度的同时降低计算量(GFLOPs减少11.9%)。该论文通过动态注意力与双向融合策略,在安全帽检测任务中实现了精度与效率的平衡,为工业场景下的实时安全监控提供了可靠解决方案。未来可结合多模态数据与自监督学习进一步提升鲁棒性。原创 2025-04-15 20:24:06 · 362 阅读 · 0 评论 -
论文精度:双分支图Transformer网络:视频驱动的3D人体网格重建新突破
在智能机器人交互、虚拟现实、动作捕捉等领域,3D人体网格重建技术扮演着核心角色。通过从视频中恢复人体的三维姿态和表面形状,机器人可以准确感知人类动作意图,实现更自然的协作;影视制作中可生成高保真数字人动画;医疗领域可辅助运动康复分析。DGTR通过创新的双分支架构,在3D人体重建领域实现了准确性与流畅性的双重突破。其轻量化的设计使实时部署成为可能,为智能机器人、元宇宙等前沿领域提供了新的技术基座。随着后续研究的深入,这项技术有望推动人机交互进入新的发展阶段。原创 2025-04-14 23:30:38 · 388 阅读 · 0 评论 -
论文精度:BoltzFormer:基于Boltzmann采样的动态稀疏注意力机制在小物体图像分析中的应用
在医学影像分析中,肺结节、肿瘤病灶等微小目标的检测与分割是核心任务,但这些目标往往仅占整幅图像的0.1%以下。其中温度参数τℓ=τ0/(1+ℓ)实现退火策略,层数ℓ增加时温度下降。BoltzFormer的核心是通过。原创 2025-04-13 21:38:59 · 284 阅读 · 0 评论 -
可发1区的超级创新思路(python 、MATLAB实现):基于SAM+Informer+2DCNN的功率预测模型
首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴!原创 2025-04-10 20:59:13 · 465 阅读 · 0 评论 -
基于层次建模与交叉注意力融合的医学视觉问答系统(HiCA-VQA)详解
这篇论文提出了一种针对医学视觉问答(Medical Visual Question Answering, Med-VQA)的层次化建模框架 HiCA-VQA,旨在解决现有方法在层次化语义建模和跨模态融合上的不足。以下是论文的核心结构:引言介绍了Med-VQA的临床价值及现有问题:传统方法忽略层次化诊断逻辑,跨模态融合依赖全局自注意力导致局部语义丢失。提出HiCA-VQA的两大创新:分层提示模块和交叉注意力融合模块。相关工作。原创 2025-04-07 23:12:15 · 178 阅读 · 0 评论 -
可发1区的超级创新思路(python\matlab实现):MPTS+Lconv+注意力集成机制的Transformer时间序列模型
首先声明,该模型为原创!原创!原创!且该思路还未有成果发表,感兴趣的小伙伴可以借鉴!原创 2025-03-30 23:18:40 · 296 阅读 · 0 评论 -
可变形交互注意力模块(DIA-Module)及代码详解
该模块通过动态调整卷积核的采样位置,实现了对不同尺度和形状的特征的自适应捕捉,同时利用注意力机制增强了模型对关键特征的关注能力。通过这种精心设计的模块框架,DIA - Module能够在保持高效计算的同时,更好地捕捉复杂数据中的关键特征,为各种深度学习任务提供强大的特征表示能力。通过这些精心设计的参数配置,DIA - Module能够在保持高效计算的同时,更好地捕捉复杂数据中的关键特征,为各种深度学习任务提供强大的特征表示能力。在可变形采样的基础上,DIA - Module引入了注意力机制。原创 2025-03-25 23:28:10 · 478 阅读 · 0 评论 -
共注意力机制及创新点深度解析
交替式注意力通过多次迭代逐步细化关注区域,实验显示3次迭代后准确率提升4.2%,同步学习图像和问题两个模态的关键信息。共注意力机制(Co-Attention)通过建立。其中W∈R^{d×d}为可学习参数矩阵。原创 2025-03-20 23:13:52 · 590 阅读 · 0 评论 -
轻量化注意力机制模型详解及代码复现
通过精心设计的损失函数,LANMSFF模型能够更好地捕捉图像中的关键特征,提高预测的准确性和模型的泛化能力,从而在各种实际应用中展现出优异的性能。通过这些创新设计,LANMSFF模型能够在不同尺度和复杂度的任务中保持良好的性能,同时保持较低的模型复杂度,为实际应用提供了更广泛的可能性。通过将输入特征图沿着通道维度拆分为多个组,然后对每个组分别应用注意力机制,最后再将这些组的特征进行融合,模型能够更有效地捕捉不同尺度和层次的特征信息,从而提高模型的泛化能力。原创 2025-03-16 13:45:46 · 375 阅读 · 0 评论 -
极性感知线性注意力机制详解及代码复现
线性投影通过将查询向量和键向量映射到低维空间,大大减少了所需的计算资源,使得模型能够处理更长的输入序列,同时保持较高的计算效率。线性投影的核心优势在于它能够显著降低计算复杂度。这种线性投影方法与极性分离技术相结合,使得极性感知线性注意力机制能够在保持计算效率的同时,提高模型的表达能力和泛化能力。通过这些创新的注意力计算方法,极性感知线性注意力机制能够在保持计算效率的同时,提高模型的表达能力和泛化能力。通过这些创新的极性分离技术,极性感知线性注意力机制能够在保持计算效率的同时,提高模型的表达能力和泛化能力。原创 2025-03-05 17:26:14 · 321 阅读 · 0 评论 -
原生稀疏注意力NSA详解及代码复现
例如,在处理技术文档时,可能需要较大的K值来确保重要的技术术语被选中,而在处理一般性新闻文章时,较小的K值可能就足够了。这种计算强度平衡的设计不仅提高了模型的计算效率,还为NSA在实际应用中的部署提供了强有力的支持。通过充分利用现代硬件的特性,NSA能够在保持模型性能的同时,显著降低计算成本,为下一代大型语言模型的发展开辟了新的道路。此外,不同类型的数据可能需要不同的压缩参数,以达到最佳的性能表现。通过这种精心设计的并行处理策略,NSA不仅提高了模型的计算效率,还为其在实际应用中的部署提供了强有力的支持。原创 2025-03-09 22:59:50 · 646 阅读 · 0 评论 -
渐进稀疏注意力PSA详解及代码复现
这种优化主要源于对GPU的Tensor Core特性的充分利用,通过高效的并行计算设计,显著提升了模型的计算效率。通过这些创新的计算优化策略,渐进稀疏注意力机制在保持模型性能的同时,实现了显著的计算效率提升。通过这些创新的数据结构设计,渐进稀疏注意力算法在保持模型性能的同时,实现了显著的计算效率提升,为处理长序列数据的大规模深度学习任务提供了更高效的解决方案。渐进稀疏注意力机制的数学模型是其核心设计的基础,它巧妙地结合了稀疏性和渐进性的特点,以优化大规模深度学习模型的计算效率。这个模型的关键创新在于其。原创 2025-03-09 22:58:55 · 275 阅读 · 0 评论
分享