自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(988)
  • 收藏
  • 关注

原创 【YoloV12改进策略】基于流形约束超连接(mHC)增强YoloV12全局特征提取能力_独家复现_梁文峰署名论文

论文标题:流形约束超连接 (Manifold-Constrained Hyper-Connections, mHC)核心问题:针对超连接 (Hyper-Connections, HC) 扩展残差流宽度时破坏恒等映射、引发训练不稳定性和高内存开销的问题,提出一种约束性框架。目标:恢复残差连接的稳定性与可扩展性,同时保持HC的性能增益。基准模型:基于DeepSeek-V3的MoE架构,进行了3B、9B、27B模型的实验验证。论文图示mHC 是一个通用的HC扩展框架。

2026-01-03 18:28:54 1145

原创 【YoloV8改进策略】基于流形约束超连接(mHC)增强YoloV8全局特征提取能力_独家复现_梁文峰署名论文

论文标题:流形约束超连接 (Manifold-Constrained Hyper-Connections, mHC)核心问题:针对超连接 (Hyper-Connections, HC) 扩展残差流宽度时破坏恒等映射、引发训练不稳定性和高内存开销的问题,提出一种约束性框架。目标:恢复残差连接的稳定性与可扩展性,同时保持HC的性能增益。基准模型:基于DeepSeek-V3的MoE架构,进行了3B、9B、27B模型的实验验证。论文图示mHC 是一个通用的HC扩展框架。

2026-01-03 18:28:04 710

原创 【YoloV11改进策略】基于流形约束超连接(mHC)增强YoloV11全局特征提取能力|独家复现|梁文峰署名论文

论文标题:流形约束超连接 (Manifold-Constrained Hyper-Connections, mHC)核心问题:针对超连接 (Hyper-Connections, HC) 扩展残差流宽度时破坏恒等映射、引发训练不稳定性和高内存开销的问题,提出一种约束性框架。目标:恢复残差连接的稳定性与可扩展性,同时保持HC的性能增益。基准模型:基于DeepSeek-V3的MoE架构,进行了3B、9B、27B模型的实验验证。论文图示mHC 是一个通用的HC扩展框架。

2026-01-03 18:25:33 1074

原创 【Yolo12改进策略】MRFA 小核协同,构建巨大的感受野,同时保持高斯型分布|即插即用|ICCV2025

本文将介绍如何将 UniConvNet 论文中的核心模块——感受野聚合器集成到 Yolo12中,通过一种新颖的“小核协同”范式,在不显著增加计算开销的前提下,显著提升模型的感受野质量和检测精度。在目标检测中,模型要识别一个物体,不仅需要看到物体的局部特征,更需要理解其周围的上下文信息。传统卷积网络通过堆叠小卷积核(如 3x3)来扩大“感受野”,但这个过程缓慢且效率低下。而近期流行的大核卷积,虽然感受野大,但会破坏“距离越近、影响越大”的自然分布,且带来巨大的计算负担。MRFA 找到了一条“中间道路”:它通过

2026-01-01 19:07:20 744

原创 【YoloV8改进策略】MRFA 小核协同,构建巨大的感受野,同时保持高斯型分布|即插即用|ICCV2025

将 MRFA 集成到 YoloV8,不仅仅是一次简单的模块替换,更是将“感受野质量”这一先进设计理念注入到了经典检测框架中。感受野的大小并非唯一追求,其内部特征的渐近高斯分布对性能至关重要。精巧的结构设计,通过多个中等尺寸核的协同工作,可以比单一巨大核更高效、更智能地构建优质感受野。即插即用的改进证明了该技术的通用性和实用性,为YOLO系列模型的进化提供了新的、强有力的工具。期待社区基于这一改进进行更深入的探索和验证,例如在不同规模的数据集上进行训练,或将其应用于 YOLO 的其他变体。

2026-01-01 19:04:05 646

原创 【Yolo11改进策略】MRFA 小核协同,构建巨大的感受野,同时保持高斯型分布|即插即用|ICCV2025

将 MRFA 集成到 YOLOv11,不仅仅是一次简单的模块替换,更是将“感受野质量”这一先进设计理念注入到了经典检测框架中。感受野的大小并非唯一追求,其内部特征的渐近高斯分布对性能至关重要。精巧的结构设计,通过多个中等尺寸核的协同工作,可以比单一巨大核更高效、更智能地构建优质感受野。即插即用的改进证明了该技术的通用性和实用性,为YOLO系列模型的进化提供了新的、强有力的工具。期待社区基于这一改进进行更深入的探索和验证,例如在不同规模的数据集上进行训练,或将其应用于 YOLO 的其他变体。

2026-01-01 18:07:53 563

原创 Yolo11改进策略:下采样改进|IPFA,下采样|信息保留特征聚合模块|即插即用

IPFAIF-YOLO 的成功,不仅在于性能提升,更在于其系统性思维不是“头痛医头”,而是从特征生成到融合的全链路优化。尽管在极端低光或严重模糊场景下仍有挑战,但该工作为无人机视觉、遥感检测等领域提供了极具价值的技术路径。未来,结合图像增强与轻量化设计,IF-YOLO 有望在边缘设备(如无人机机载芯片)上落地,真正实现“看得清、认得准、飞得稳”。

2025-11-04 19:00:00 1553

原创 Yolo12改进策略:下采样改进|IPFA,下采样|信息保留特征聚合模块|即插即用

IPFAIF-YOLO 的成功,不仅在于性能提升,更在于其系统性思维不是“头痛医头”,而是从特征生成到融合的全链路优化。尽管在极端低光或严重模糊场景下仍有挑战,但该工作为无人机视觉、遥感检测等领域提供了极具价值的技术路径。未来,结合图像增强与轻量化设计,IF-YOLO 有望在边缘设备(如无人机机载芯片)上落地,真正实现“看得清、认得准、飞得稳”。

2025-11-04 19:00:00 899

原创 YoloV8改进策略:下采样改进|IPFA,下采样|信息保留特征聚合模块|即插即用

IPFAIF-YOLO 的成功,不仅在于性能提升,更在于其系统性思维不是“头痛医头”,而是从特征生成到融合的全链路优化。尽管在极端低光或严重模糊场景下仍有挑战,但该工作为无人机视觉、遥感检测等领域提供了极具价值的技术路径。未来,结合图像增强与轻量化设计,IF-YOLO 有望在边缘设备(如无人机机载芯片)上落地,真正实现“看得清、认得准、飞得稳”。

2025-11-04 18:15:52 993

原创 Yolo12改进策略:下采样改进|即插即用|25年10最新创新点

PRNet 的成功在于其返璞归真的设计哲学——珍视并高效利用最原始的信息。它没有堆砌复杂的后处理模块,而是从特征提取的源头(下采样)和特征融合的核心(颈部网络)入手,系统性地解决了小目标检测中的信息退化问题。对于关注模型优化、下采样方法和多尺度特征融合的研究者与工程师而言,PRNet 提供了一个极具启发性的新范式。它不仅在学术上推动了小目标检测的发展,其优异的实时性能也为其在无人机、智慧城市等实际场景中的落地应用铺平了道路。

2025-10-28 06:32:42 1044

原创 Yolo11改进策略:下采样改进|即插即用|25年10最新创新点

PRNet 的成功在于其返璞归真的设计哲学——珍视并高效利用最原始的信息。它没有堆砌复杂的后处理模块,而是从特征提取的源头(下采样)和特征融合的核心(颈部网络)入手,系统性地解决了小目标检测中的信息退化问题。对于关注模型优化、下采样方法和多尺度特征融合的研究者与工程师而言,PRNet 提供了一个极具启发性的新范式。它不仅在学术上推动了小目标检测的发展,其优异的实时性能也为其在无人机、智慧城市等实际场景中的落地应用铺平了道路。

2025-10-28 06:32:02 809

原创 YoloV8改进策略:下采样改进|即插即用|25年10最新创新点

PRNet 的成功在于其返璞归真的设计哲学——珍视并高效利用最原始的信息。它没有堆砌复杂的后处理模块,而是从特征提取的源头(下采样)和特征融合的核心(颈部网络)入手,系统性地解决了小目标检测中的信息退化问题。对于关注模型优化、下采样方法和多尺度特征融合的研究者与工程师而言,PRNet 提供了一个极具启发性的新范式。它不仅在学术上推动了小目标检测的发展,其优异的实时性能也为其在无人机、智慧城市等实际场景中的落地应用铺平了道路。

2025-10-28 06:30:57 798

原创 【Yolo12改进策略】上采样改进|EUCB,轻量高效的上采样模块|即插即用

作为当前最先进的实时目标检测与实例分割模型之一,其在速度与精度之间取得了出色的平衡。然而,在资源受限的边缘设备或对实时性要求极高的应用场景中,Yolo12的计算开销,尤其是在特征金字塔网络(FPN)和路径聚合网络(PAN)中用于特征融合的上采样操作,仍然是一个瓶颈。Yolo12的颈部(Neck)结构中广泛使用nn.Upsample进行上采样,该操作虽然简单,但缺乏对特征内容的感知能力,且后续通常需要标准卷积来修复因插值带来的伪影,这增加了不必要的计算负担。

2025-10-03 07:54:42 988

原创 【Yolo11改进策略】上采样改进|EUCB,轻量高效的上采样模块|即插即用

作为当前最先进的实时目标检测与实例分割模型之一,其在速度与精度之间取得了出色的平衡。然而,在资源受限的边缘设备或对实时性要求极高的应用场景中,Yolo11的计算开销,尤其是在特征金字塔网络(FPN)和路径聚合网络(PAN)中用于特征融合的上采样操作,仍然是一个瓶颈。Yolo11的颈部(Neck)结构中广泛使用nn.Upsample进行上采样,该操作虽然简单,但缺乏对特征内容的感知能力,且后续通常需要标准卷积来修复因插值带来的伪影,这增加了不必要的计算负担。

2025-10-03 07:46:12 912 2

原创 【YoloV8改进策略】上采样改进|EUCB,轻量高效的上采样模块|即插即用

YOLOv8作为当前最先进的实时目标检测与实例分割模型之一,其在速度与精度之间取得了出色的平衡。然而,在资源受限的边缘设备或对实时性要求极高的应用场景中,YOLOv8的计算开销,尤其是在特征金字塔网络(FPN)和路径聚合网络(PAN)中用于特征融合的上采样操作,仍然是一个瓶颈。YOLOv8的颈部(Neck)结构中广泛使用nn.Upsample进行上采样,该操作虽然简单,但缺乏对特征内容的感知能力,且后续通常需要标准卷积来修复因插值带来的伪影,这增加了不必要的计算负担。

2025-10-03 07:40:44 622

原创 【Yolo12改进策略】Neck改进|sMLP,全新的“稀疏MLP”模块|即插即用|原模型改进

这篇论文通过提出。

2025-10-02 09:04:00 689

原创 【Yolo11改进策略】Neck改进|sMLP,全新的“稀疏MLP”模块|即插即用|原模型改进

这篇论文通过提出。

2025-09-24 20:05:42 372

原创 【YoloV8改进策略】Neck改进|sMLP,全新的“稀疏MLP”模块|即插即用|原模型改进

这篇论文通过提出。

2025-09-24 20:03:57 222

原创 【Yolo12改进策略】卷积篇|引入FDConv:在频域为你的检测器注入超强自适应能力|即插即用|CVPR2025

FDConv为我们提供了一种全新的、从频域出发的卷积设计范式。将其引入Yolo12,不仅是对模型性能的一次有效提升,更是对“如何让卷积神经网络更好地理解图像”这一根本问题的深刻探索。通过替换。

2025-09-17 06:55:58 974

原创 【Yolo11改进策略】卷积篇|引入FDConv:在频域为你的检测器注入超强自适应能力|即插即用|CVPR2025

FDConv为我们提供了一种全新的、从频域出发的卷积设计范式。将其引入Yolo11,不仅是对模型性能的一次有效提升,更是对“如何让卷积神经网络更好地理解图像”这一根本问题的深刻探索。通过替换。

2025-09-17 06:53:32 1346

原创 【YoloV8改进策略】卷积篇|引入FDConv:在频域为你的检测器注入超强自适应能力|即插即用|CVPR2025

FDConv为我们提供了一种全新的、从频域出发的卷积设计范式。将其引入YOLOv8,不仅是对模型性能的一次有效提升,更是对“如何让卷积神经网络更好地理解图像”这一根本问题的深刻探索。通过替换。

2025-09-17 06:50:23 1100

原创 Yolo12改进策略:上采样改进|反卷积|数学上可逆的反卷积」塞进 YOLO12,涨点不涨参!图像恢复黑科技 Converse2D 的跨界奇袭!

这不是缝合怪,这是数学优雅 + 工程实用的完美结合!在目标检测模型中,尤其是 YOLO 系列,上采样(Upsample) 是特征金字塔(FPN/PANet)中不可或缺的一环 —— 它负责把低分辨率高层语义特征“放大”,和高分辨率浅层特征融合,提升小目标检测能力。但传统做法(如 )存在几个痛点:于是,我盯上了这篇 2025 年新鲜出炉的论文 —— 《Reverse Convolution and Its Applications to Image Restoration》。它提出的 Converse2D,不是

2025-09-16 10:33:08 137

原创 Yolo11改进策略:上采样改进|反卷积|数学上可逆的反卷积」塞进 YOLO11,涨点不涨参!图像恢复黑科技 Converse2D 的跨界奇袭!

这不是缝合怪,这是数学优雅 + 工程实用的完美结合!在目标检测模型中,尤其是 YOLO 系列,上采样(Upsample) 是特征金字塔(FPN/PANet)中不可或缺的一环 —— 它负责把低分辨率高层语义特征“放大”,和高分辨率浅层特征融合,提升小目标检测能力。但传统做法(如 )存在几个痛点:于是,我盯上了这篇 2025 年新鲜出炉的论文 —— 《Reverse Convolution and Its Applications to Image Restoration》。它提出的 Converse2D,不是

2025-09-15 18:11:28 242

原创 YoloV8改进策略:上采样改进|反卷积|数学上可逆的反卷积」塞进 YOLOv8,涨点不涨参!图像恢复黑科技 Converse2D 的跨界奇袭!

通过网盘分享的文件:YoloV8改进策略:上采样改进-反卷积-数学上可逆的反卷积-塞进 YOLOv8,涨点不涨参!图像恢复黑科技 Converse2D 的跨界奇袭链接: https://pan.baidu.com/s/19KuF-LFW-1yUBACk1tPDuA?pwd=pneg 提取码: pneg--来自百度网盘超级会员v4的分享。

2025-09-15 14:20:02 415

原创 YoloV11改进策略:Neck改进|DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性|即插即用

本文受Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块启发,将其引入并适配到YOLOv11的Neck中,旨在通过增强空间特征表达能力,显著提升目标检测性能。与原始的Flora-NET(专为图像分类设计)不同,本文专注于目标检测任务,通过系统实验验证了DCAFE模块在YOLOv8不同位置集成的效果,并提供了完整的训练策略和性能分析。实验结果表明,该改进方案在保持模型轻量化的同时,有效提升了检测精度。

2025-09-11 06:52:47 556

原创 YoloV8改进策略:Neck改进|DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性|即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv8架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。

2025-09-09 07:00:19 619

原创 MiniCPM-V 4.5实战,实现图片、视频、多图的推理

MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强大的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有了显著提升,并引入了新的实用功能。MiniCPM-V 4.5 的主要特点包括:🔥 最先进的视觉-语言能力。MiniCPM-V 4.5 在 OpenCompass 上的平均得分为 77.0,这是一个涵盖 8 个流行基准的综合评估。

2025-09-01 18:42:38 1624

原创 Transformer中的QKV揭秘:从入门到实践(含流程图)

Transformer模型彻底改变了自然语言处理领域,而其中的核心——注意力机制(Attention)的QKV三要素,是理解Transformer的关键。很多初学者看到Q(Query)、K(Key)、V(Value)就一头雾水:它们到底是什么?从哪里来?为什么需要它们?本文将用最直观的方式,带你彻底理解QKV的原理,配有详细流程图和可运行代码,保证小白也能轻松掌握!概念说明关键点Q(Query)“提问者”,表示当前关注点决定"我想知道什么"K(Key)“标签”,表示内容特征。

2025-08-30 08:05:35 2502

原创 【面试问题】QLoRA与LoRA的深度对比:从原理到实践(小白友好版)

LoRA是"给大模型打补丁"的技术,只训练少量参数;QLoRA4-bit压缩大模型LoRA补丁,让普通电脑也能微调大模型。

2025-08-29 10:01:51 1033

原创 YoloV12改进策略:Block改进-DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性-即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv12架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。YOLOv11采用CSP瓶颈模块和ABlock作为核心构建单元,通过通道压缩-特征提取-通道扩展的流程平衡计算效率与特征表达能力。其标准Bottleneck模块可表示为:ABlock模块流程图:是否是否激活函数Conv1: dim → dim*mlp_ratioConv

2025-08-29 06:17:46 428

原创 【数据集总结】红外目标检测数据集全解析:构建全天候感知系统的基石

红外目标检测数据集为构建全天候、全场景的感知系统提供了不可或缺的资源。随着自动驾驶技术的发展,热红外传感器与可见光、Lidar、雷达的多模态融合将成为行业标准。选择合适的数据集进行算法开发和验证,对于提升系统在各种挑战性条件下的性能至关重要。通过本文介绍的这些高质量数据集,研究人员和工程师可以更有效地开发和验证红外目标检测算法,推动自动驾驶和智能监控技术的发展,最终实现更安全、更可靠的智能系统。提示。

2025-08-25 12:51:04 997

原创 【无人机巡检】基于YOLO的桥梁缺陷检测数据集与模型训练实践

本数据集是一套专为桥梁缺陷检测设计的高质量数据集,主要聚焦于混凝土桥梁结构,包含6308张经过专业标注的真实桥梁缺陷图像。该数据集旨在支持桥梁检测、结构健康监测以及缺陷自动识别的相关研究与应用,为计算机视觉技术在基础设施维护领域的应用提供了坚实基础。腐蚀:桥梁表面钢筋或钢结构的锈蚀现象,是影响结构安全的主要隐患之一裂缝:混凝土表面出现的各类裂缝,包括细小裂缝和大面积裂缝,反映结构受力状态退化混凝土:由于环境因素或时间推移,混凝土表面发生老化、退化的现象混凝土空洞。

2025-08-25 06:41:58 818

原创 【模型实战】MiMo-VL-7B讲解与实战

维度成绩MMMU70.6(图像理解最难测试之一)VideoMME70.8(视频理解标杆)59.4(超越78B参数模型)56.1(超过专用GUI模型)Elo评分开源VLM排名第一(7B~72B)社区热度过去一个月下载超1,600次(RL+SFT)📌一句话概括MiMo-VL 是目前性能最强、推理最稳、体验最佳、生态最全的7B级开源视觉语言模型。

2025-08-24 08:03:17 862

原创 MiMo-VL 技术报告

我们开源了 MiMo-VL-7B-SFT 和 MiMo-VL-7B-RL 两个强大的视觉语言模型,它们在通用视觉理解和多模态推理方面均展现出最先进的性能。MiMo-VL-7B-RL 在 40 项评估任务中的 35 项上优于 Qwen2.5-VL-7B,并在 OlympiadBench 上获得 59.4 分,超越了参数量高达 780 亿的模型。对于 GUI 定位应用,它在 OSWorld-G 上达到了 56.1 分,树立了新的标准,甚至超越了 Ui-TARS 等专业模型。

2025-08-24 07:30:16 141

原创 YoloV11改进策略:Block改进-DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性-即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv11架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。

2025-08-22 21:37:06 485

原创 YoloV10改进策略:Block改进-DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性-即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv10架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。

2025-08-21 07:30:47 369

原创 【面试题集】SFT后为什么还需要用RLHF

SFT让模型「知道答案」,RLHF让模型「知道怎么答才让人想继续聊」——就像学霸和班主任的区别,前者会解题,后者懂人心。

2025-08-18 11:26:44 741

原创 YoloV9改进策略:Block改进-DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性-即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv9架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。

2025-08-17 20:03:15 671 3

原创 YoloV8改进策略:Block改进|DCAFE,并行双坐标注意力机制,增强长程依赖与抗噪性|即插即用

本文研究将Flora-NET中提出的双坐标注意力特征提取(DCAFE)模块集成到YOLOv8架构中,通过增强空间特征表达能力,显著提目标检测性能。与原始研究不同,本文不仅提供理论分析,更通过系统实验验证了改进效果,并提供了完整的训练策略。

2025-08-17 09:58:38 644

原创 【提问技巧】与AI高效对话的秘密武器:四象限框架实战指南

在这个AI快速进化的时代,我们真正需要修炼的不是信息量,而是提炼信息和连接信息的能力。正如爱因斯坦所言:"重要的从来就不是知识,而是想象力。"而在AI时代,我们应补充一句:重要的不仅是想象力,更是引导AI发挥想象力的方式。我们现在处于哪个象限?我需要调整提问策略吗?如何让这次对话更有价值?别再当一个不会聊天的AI指令人,而要成为能与AI共创未来的合伙人。当你掌握了四象限框架,每一次与AI的对话都将不再是简单的问答,而是一场富有成效的知识共创之旅。AI的进化不是终点,人类的提问才是起点。

2025-08-16 20:57:31 258

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除