- 博客(2020)
- 收藏
- 关注
原创 YOLO26-seg分割 魔术师专栏|全网独家首发!2026 原创级创新赋能 CV 全场景
🔥 基于 YOLO26 核心架构迭代,融合顶会前沿成果,打造更高效更灵活更具创新性的计算机视觉解决方案!专栏核心创新方向。
2026-05-09 10:12:10
484
原创 YOLO26 魔术师专栏|全网独家首发!2026 原创级创新赋能 CV 全场景
基于 YOLO26 核心架构迭代,融合原创自研、2026 AAAI/CVPR/ICCV 顶会前沿成果,打造更高效、更灵活、更具创新性的计算机视觉解决方案!
2026-01-22 09:33:06
3213
5
原创 《YOLO11魔术师专栏》专栏介绍 & 专栏目录
【原创自研模块】【多组合点优化】【注意力机制】【主干篇】【neck优化】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇】
2024-10-12 13:19:28
12532
34
原创 《RT-DETR魔术师》专栏介绍 & CSDN独家改进创新实战 & 专栏目录
通过本专栏的阅读,后续你也可以自己魔改网络,在网络不同位置(Backbone、head、neck、loss等)进行魔改,实现创新!!!
2023-11-14 20:54:20
6790
26
原创 《YOLOv8-Pose关键点检测》专栏介绍 & CSDN独家改进创新实战 & 专栏目录
YOLOv8-Pose关键点检测:1)手把手从数据集标注、训练到模型的教程;2)模型轻量化创新;3)loss优化教程
2023-11-02 09:19:27
7715
19
原创 《深度学习工业缺陷检测》专栏介绍 & CSDN独家改进实战
深度学习工业缺陷检测:1)提供工业小缺陷检测性能提升方案,满足部署条件;2)针对缺陷样品少等难点,引入无监督检测;3)深度学习 C++、C#部署方案;4)实战工业缺陷检测项目,学习如何选择合适的框架和模型;
2023-09-22 21:05:56
7060
25
原创 产线还在用YOLO“画框”?Qwen3-VL-Seg让质检真正“开口闭环”
维度传统YOLO方案YOLO+Qwen3-VL-Seg协同方案输出形式仅边界框+类别像素级掩码+JSON结构化诊断报告缺陷分类预定义固定类别零样本开放词汇识别诊断深度“这里有问题”“是什么、为什么、怎么办”工艺闭环无法反哺弱监督反馈+LoRA增量优化边缘部署实时推理(<10ms)YOLO实时检测+大模型离线诊断工业质检正处于从“机器视觉”到“机器思维”的跃迁拐点。过去,AI只能回答“这是什么缺陷”;现在,Qwen3-VL可以回答“为什么产生这个缺陷”和“该怎么解决”。
2026-06-03 12:35:38
323
原创 基于YOLO26的PCB表面缺陷检测系统(Python源码+数据集+Pyside6界面)
摘要:本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其关键架构改进及其在实时边缘目标检测中的性能基准测试。YOLO26于2025年9月发布,是YOLO系列最新、最先进的成员,专为在边缘及低功耗设备上实现高效、精确且易于部署的目标而构建。本文依次详述了YOLO26的架构创新,包括:移除了分布焦点损失(DFL);采用端到端的无NMS推理;集成了渐进损失(ProgLoss)与小目标感知标签分配(STAL);以及引入了用于稳定收敛的MuSGD优化器。
2026-06-02 12:37:51
231
原创 TDD-YOLO:一种用于番茄病害精准检测的新型模型
在Tomato-Village和Tomato-Disease数据集上,相比YOLOv11n,平均mAP@50分别提高4.1%和3.6%,mAP@50:95分别提高6.0%和3.9%,超越现有SOTA模型。
2026-05-26 14:17:14
397
原创 YOLO26-seg分割全网首发:CVPR2026 UCMNet |FrequencyCM赋能YOLO C3k2:从频域增强视角解决感受野与细节瓶颈
FrequencyCM引入YOLO C3k2的优势:1)频域增强:显式利用傅里叶域信息,提升高频细节恢复能力,改善低分辨、模糊目标检测。2)全局感受野:以极低计算开销获得整图级感受野,突破局部视野瓶颈。3)轻量高效:模块参数量和FLOPs增量极小,即插即用,训练稳定,推理速度快于窗口注意力
2026-05-26 10:41:30
381
原创 YOLO26-seg分割全网首发:TIP2026 FourierSR | FourierSR引入YOLO C3k2:解决感受野局限,实现高效全局特征交互
FourierSR 使 C3k2 兼具全局建模能力与轻量高效特性,尤其适用于小目标、低对比度等分割挑战场景。
2026-05-26 10:35:28
371
原创 LLM智能体加持YOLO26-MoE:无人机绝缘子故障检测新方案
电力线路绝缘子的检测对于确保电网可靠性和防止因绝缘部件损坏或退化引发的故障至关重要。近年来,无人机结合基于深度学习的视觉系统已成为实现该过程自动化的有效解决方案。然而,由于缺陷区域小、故障模式异质、背景复杂以及成像条件多变,绝缘子故障检测仍然具有挑战性。为应对这些挑战,本文提出了一种优化的YOLO26-MoE,这是一种新颖的目标检测架构,它将稀疏混合专家模块集成到 YOLO26 检测器的高分辨率分支中。所提出的改进能够针对细微和多样化的故障模式进行自适应特征细化,同时保持了单阶段检测框架的效率。
2026-05-25 09:56:43
639
2
原创 Yolov8-pose关键点检测:CVPR2026 UCMNet |FrequencyCM赋能YOLO C2f:从频域增强视角解决感受野与细节瓶颈
屏下摄像头通过将成像传感器置于显示屏下方实现全面屏设计。然而,光线在穿过不同显示层时会发生衍射和散射,导致空间变化且复杂的图像退化,从而显著降低高频细节。当前基于点扩散函数的物理建模技术和频域分离网络在重建低频结构和保持整体色彩一致性方面表现有效,但在处理复杂、空间变化的退化时,恢复精细细节仍面临挑战。为解决这一问题,我们提出了一种轻量级的不确定性感知上下文记忆网络,用于屏下摄像头图像恢复。与先前采用统一恢复的方法不同,UCMNet 执行不确定性感知的自适应处理,以在退化程度不同的区域恢复高频细节。
2026-05-22 13:59:47
168
原创 Yolov8-pose关键点检测:TIP2026 FourierSR | FourierSR引入YOLO C2f:解决感受野局限,实现高效全局特征交互
摘要:图像超分辨率旨在将低分辨率图像恢复为高分辨率图像,其中提高超分辨率效率是一个备受关注的挑战。然而,超分辨率中常用的单元(如卷积和基于窗口的Transformer)感受野有限,这使得在极其有限的计算成本下应用它们来提高超分辨率变得困难。为了解决这个问题,受通过token混合建模卷积定理的启发,我们提出了一种基于傅里叶token的即插即用模块FourierSR,以统一方式提升超分辨率性能,这避免了现有token混合技术作为即插即用模块时的不稳定性或低效率。
2026-05-22 13:57:28
40
原创 YOLOv10优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C2f:从频域增强视角解决感受野与细节瓶颈
论文:代码:在过去的几年里,由于其在计算成本和检测性能之间的有效平衡,YOLOS已经成为实时目标检测领域的主导范例。研究人员已经探索了YOLOS的架构设计、优化目标、数据增强策略等,并取得了显著进展。然而,对用于后处理的非最大抑制(NMS)的依赖妨碍了YOLOS的端到端部署,并且影响了推理延迟。此外,YOLOS中各部件的设计缺乏全面和彻底的检查,导致明显的计算冗余,限制了模型的性能。这导致次优的效率,以及相当大的性能改进潜力。
2026-05-20 15:38:56
51
原创 YOLOv8优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C2f:从频域增强视角解决感受野与细节瓶颈
屏下摄像头通过将成像传感器置于显示屏下方实现全面屏设计。然而,光线在穿过不同显示层时会发生衍射和散射,导致空间变化且复杂的图像退化,从而显著降低高频细节。当前基于点扩散函数的物理建模技术和频域分离网络在重建低频结构和保持整体色彩一致性方面表现有效,但在处理复杂、空间变化的退化时,恢复精细细节仍面临挑战。为解决这一问题,我们提出了一种轻量级的不确定性感知上下文记忆网络,用于屏下摄像头图像恢复。与先前采用统一恢复的方法不同,UCMNet 执行不确定性感知的自适应处理,以在退化程度不同的区域恢复高频细节。
2026-05-20 15:34:43
53
原创 YOLO11优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C3k2:从频域增强视角解决感受野与细节瓶颈
Ultralytics YOLO11是一款尖端的、最先进的模型,它在之前YOLO版本成功的基础上进行了构建,并引入了新功能和改进,以进一步提升性能和灵活性。YOLO11设计快速、准确且易于使用,使其成为各种物体检测和跟踪、实例分割、图像分类以及姿态估计任务的绝佳选择。借鉴V10 PSA结构,实现了C2PSA和C2fPSA,最终选择了基于C2的C2PSA(可能涨点更好?实现代码实现代码ultralytics/nn/modules/head.py。
2026-05-20 15:23:48
184
原创 YOLOv13优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C3k2:从频域增强视角解决感受野与细节瓶颈
摘要—YOLO 系列模型因其卓越的准确性和计算效率在实时目标检测领域占据主导地位。然而,无论是 YOLO11 及更早版本的卷积架构,还是 YOLOv12 引入的基于区域的自注意力机制,都仅限于局部信息聚合和成对相关性建模,缺乏捕捉全局多对多高阶相关性的能力,这限制了在复杂场景下的检测性能。本文提出了一种准确且轻量化的YOLOv13 目标检测器。为应对上述挑战,我们提出了一种基于超图的自适应相关性增强(HyperACE)机制。
2026-05-20 13:14:17
38
原创 YOLOv12优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C3k2:从频域增强视角解决感受野与细节瓶颈
长期以来,提升YOLO框架的网络架构至关重要,但相关改进主要聚焦于基于CNN的优化,尽管注意力机制已被证实具备更卓越的建模能力。这种现状源于注意力模型在速度上始终无法与CNN模型相媲美。本研究提出了一种以注意力机制为核心的YOLO框架——YOLOv12,在保持与先前CNN模型相当速度的同时,充分释放了注意力机制的性能优势。YOLOv12在保持具有竞争力的推理速度下,其准确率超越了所有主流实时目标检测器。
2026-05-20 13:13:21
43
原创 YOLO26优化:CVPR2026 UCMNet |FrequencyCM赋能YOLO C3k2:从频域增强视角解决感受野与细节瓶颈
摘要:本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其关键架构改进及其在实时边缘目标检测中的性能基准测试。YOLO26于2025年9月发布,是YOLO系列最新、最先进的成员,专为在边缘及低功耗设备上实现高效、精确且易于部署的目标而构建。本文依次详述了YOLO26的架构创新,包括:移除了分布焦点损失(DFL);采用端到端的无NMS推理;集成了渐进损失(ProgLoss)与小目标感知标签分配(STAL);以及引入了用于稳定收敛的MuSGD优化器。
2026-05-20 13:05:02
500
原创 YOLOv10优化:TIP2026 FourierSR | FourierSR引入YOLO C2f:解决感受野局限,实现高效全局特征交互
论文:代码:在过去的几年里,由于其在计算成本和检测性能之间的有效平衡,YOLOS已经成为实时目标检测领域的主导范例。研究人员已经探索了YOLOS的架构设计、优化目标、数据增强策略等,并取得了显著进展。然而,对用于后处理的非最大抑制(NMS)的依赖妨碍了YOLOS的端到端部署,并且影响了推理延迟。此外,YOLOS中各部件的设计缺乏全面和彻底的检查,导致明显的计算冗余,限制了模型的性能。这导致次优的效率,以及相当大的性能改进潜力。
2026-05-19 09:03:43
49
原创 YOLO11优化:TIP2026 FourierSR | FourierSR引入YOLO C3k2:解决感受野局限,实现高效全局特征交互
Ultralytics YOLO11是一款尖端的、最先进的模型,它在之前YOLO版本成功的基础上进行了构建,并引入了新功能和改进,以进一步提升性能和灵活性。YOLO11设计快速、准确且易于使用,使其成为各种物体检测和跟踪、实例分割、图像分类以及姿态估计任务的绝佳选择。借鉴V10 PSA结构,实现了C2PSA和C2fPSA,最终选择了基于C2的C2PSA(可能涨点更好?实现代码实现代码ultralytics/nn/modules/head.py摘要。
2026-05-19 08:59:30
289
原创 YOLOv8优化:TIP2026 FourierSR | FourierSR引入YOLO C2f:解决感受野局限,实现高效全局特征交互
摘要:图像超分辨率旨在将低分辨率图像恢复为高分辨率图像,其中提高超分辨率效率是一个备受关注的挑战。然而,超分辨率中常用的单元(如卷积和基于窗口的Transformer)感受野有限,这使得在极其有限的计算成本下应用它们来提高超分辨率变得困难。为了解决这个问题,受通过token混合建模卷积定理的启发,我们提出了一种基于傅里叶token的即插即用模块FourierSR,以统一方式提升超分辨率性能,这避免了现有token混合技术作为即插即用模块时的不稳定性或低效率。
2026-05-19 08:59:18
54
原创 YOLOv12优化:TIP2026 FourierSR | FourierSR引入YOLO C3k2:解决感受野局限,实现高效全局特征交互
长期以来,提升YOLO框架的网络架构至关重要,但相关改进主要聚焦于基于CNN的优化,尽管注意力机制已被证实具备更卓越的建模能力。这种现状源于注意力模型在速度上始终无法与CNN模型相媲美。本研究提出了一种以注意力机制为核心的YOLO框架——YOLOv12,在保持与先前CNN模型相当速度的同时,充分释放了注意力机制的性能优势。YOLOv12在保持具有竞争力的推理速度下,其准确率超越了所有主流实时目标检测器。
2026-05-18 17:24:45
54
原创 YOLOv13优化:TIP2026 FourierSR | FourierSR引入YOLO C3k2:解决感受野局限,实现高效全局特征交互
摘要—YOLO 系列模型因其卓越的准确性和计算效率在实时目标检测领域占据主导地位。然而,无论是 YOLO11 及更早版本的卷积架构,还是 YOLOv12 引入的基于区域的自注意力机制,都仅限于局部信息聚合和成对相关性建模,缺乏捕捉全局多对多高阶相关性的能力,这限制了在复杂场景下的检测性能。本文提出了一种准确且轻量化的YOLOv13 目标检测器。为应对上述挑战,我们提出了一种基于超图的自适应相关性增强(HyperACE)机制。
2026-05-18 17:18:22
163
原创 YOLO26优化:TIP2026 FourierSR | FourierSR引入YOLO C3k2:解决感受野局限,实现高效全局特征交互
摘要:本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其关键架构改进及其在实时边缘目标检测中的性能基准测试。YOLO26于2025年9月发布,是YOLO系列最新、最先进的成员,专为在边缘及低功耗设备上实现高效、精确且易于部署的目标而构建。本文依次详述了YOLO26的架构创新,包括:移除了分布焦点损失(DFL);采用端到端的无NMS推理;集成了渐进损失(ProgLoss)与小目标感知标签分配(STAL);以及引入了用于稳定收敛的MuSGD优化器。
2026-05-18 17:16:03
214
原创 RT-DETR算法优化:CVPR2026 PFGNet | 融合外周频率门控(PFG)与 RepC3 的动态感受野增强 | 小目标检测新利器
摘要:时空预测学习旨在从过去的观测中预测未来帧,在广泛的应用中至关重要。与循环或混合架构相比,纯卷积模型具有更高的效率和完全的并行性,但其固定的感受野限制了它们自适应捕捉空间变化运动模式的能力。受生物学的中心-环绕组织和频率选择性信号处理的启发,我们提出了PFGNet,一个完全卷积框架,通过逐像素的频率引导门控动态调制感受野。核心的外周频率门控模块提取局部频谱线索,并自适应地融合多尺度大核外周响应与可学习的中心抑制,有效地形成空间自适应的带通滤波器。
2026-05-15 10:38:40
58
原创 RT-DETR算法优化:CVPR2026 MixerCSeg | DEGConv方向引导边缘门控,破解细长裂缝检测难题
摘要:特征编码器通过塑造细粒度纹理和薄结构的表示,在像素级裂缝分割中扮演着关键角色。现有的基于CNN、Transformer和Mamba的模型各自仅能捕获所需空间或结构信息的一部分,在建模复杂裂缝模式方面存在明显不足。为解决此问题,我们提出了MixerCSeg,一种混合架构,其设计如同一个协同配合的专家团队,其中类CNN路径专注于局部纹理,类Transformer路径捕获全局依赖,而类Mamba流则在单一编码器内建模序列上下文。MixerCSeg的核心是TransMixer。
2026-05-15 10:30:09
157
原创 RT-DETR算法优化:TPAMI 2026重磅创新 | 自适应稀疏自注意力机制强势来袭,让特征聚合更高效!
摘要:受益于Transformer框架中自注意力机制在建模图像非局部特征方面的有效性,图像超分辨率领域已取得显著进展。我们注意到,现有的自注意力机制通常探索查询与键之间所有令牌的相似性以进行特征聚合。然而,由于并非查询中的所有令牌都与键中的令牌相关,使用所有相似性并不能有效促进高质量图像重建。我们进一步注意到,自注意力机制对于局部特征探索效果不佳,而这对于结构细节的恢复是必要的。为克服这些问题,我们开发了一种简单而有效的自适应稀疏自注意力方法,以利用令牌中最有用的信息进行图像恢复。
2026-05-15 10:19:36
51
原创 RT-DETR算法优化:轻量化涨点设计 | 融合PartialNet Block的C3k2-YOLO高效目标检测网络 | PartialNet AAAI2026
摘要:设计一种能够使网络在保持低参数量和低FLOPs的同时不牺牲精度和吞吐量的模块或机制仍然是一个挑战。部分通道机制。具体来说,通过分割操作,特征图通道被划分为不同的部分,每个部分对应不同的操作,例如卷积、注意力、池化和恒等映射。基于这一设想,我们引入了一种新颖的部分注意力卷积,它可以有效地将卷积与视觉注意力结合起来。我们的探索表明,PATConv可以在减少模型参数和FLOPs的同时,完全替代常规卷积和常规视觉注意力。部分通道注意力模块部分空间注意力模块和部分自注意力模块。接着,我们提出了一种新颖的。
2026-05-15 10:13:10
46
原创 RT-DETR算法优化:CVPR2026 Transformer注意力 | BinaryAttention 1-bit注意力,推理提速100%,超越FlashAttention2
摘要:Transformer 已取得广泛而显著的成功,但其注意力模块的计算复杂性仍然是视觉任务的主要瓶颈。现有方法主要采用 8-bit 或 4-bit 量化来平衡效率与精度。在本文中,我们通过理论论证指出,注意力的二值化保留了基本的相似性关系,并提出了,一种用于快速且准确的 1-bit qk-注意力计算方法。具体来说,在计算注意力时,我们仅保留查询和键的符号,并用位运算替代浮点点积,从而显著降低计算成本。我们通过引入可学习偏置来减轻 1-bit 量化下固有的信息损失,并实现了端到端的加速。
2026-05-15 10:12:53
127
原创 Yolov8-pose关键点检测:CVPR2026 FAA| 解决YOLO Neck跨尺度方向冲突--- FAAFusion频域对齐融合模块 | 暴力涨点篇
摘要:在遥感旋转目标检测中,主流方法存在两个瓶颈:检测器颈部的方向不一致性和检测头的任务冲突。利用傅里叶旋转等变性,我们引入了傅里叶角度对齐,该方法通过频谱分析角度信息,并将主方向对齐到特定方向。FAAFusion和FAA Head。FAAFusion 作用于检测器颈部,将高层特征的主方向对齐到低层特征后进行融合。FAA Head 作为一个新的检测头,将 RoI 特征预对齐到规范角度,并在分类和回归之前将其与原始特征相加。
2026-05-15 09:41:02
502
原创 Yolov8-pose关键点检测:CVPR2026 PFGNet | 融合外周频率门控(PFG)与 C2f 的动态感受野增强 | 小目标检测新利器
摘要:时空预测学习旨在从过去的观测中预测未来帧,在广泛的应用中至关重要。与循环或混合架构相比,纯卷积模型具有更高的效率和完全的并行性,但其固定的感受野限制了它们自适应捕捉空间变化运动模式的能力。受生物学的中心-环绕组织和频率选择性信号处理的启发,我们提出了PFGNet,一个完全卷积框架,通过逐像素的频率引导门控动态调制感受野。核心的外周频率门控模块提取局部频谱线索,并自适应地融合多尺度大核外周响应与可学习的中心抑制,有效地形成空间自适应的带通滤波器。
2026-05-15 09:36:52
260
原创 YOLO26分割如何涨点系列篇(裂缝分割crack-seg) | CVPR2026 MixerCSeg | DEGConv方向引导边缘门控,破解细长裂缝检测难题
摘要:本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其关键架构改进及其在实时边缘目标检测中的性能基准测试。YOLO26于2025年9月发布,是YOLO系列最新、最先进的成员,专为在边缘及低功耗设备上实现高效、精确且易于部署的目标而构建。本文依次详述了YOLO26的架构创新,包括:移除了分布焦点损失(DFL);采用端到端的无NMS推理;集成了渐进损失(ProgLoss)与小目标感知标签分配(STAL);以及引入了用于稳定收敛的MuSGD优化器。
2026-05-13 08:50:46
399
原创 YOLO26分割如何涨点系列篇(裂缝分割crack-seg) | 一种新颖的大核局部-全局-局部(LGL)模块,有效平衡图像信息低与高层语义差异大的问题,实现高效涨点
摘要:本研究对Ultralytics YOLO26进行了全面分析,重点阐述了其关键架构改进及其在实时边缘目标检测中的性能基准测试。YOLO26于2025年9月发布,是YOLO系列最新、最先进的成员,专为在边缘及低功耗设备上实现高效、精确且易于部署的目标而构建。本文依次详述了YOLO26的架构创新,包括:移除了分布焦点损失(DFL);采用端到端的无NMS推理;集成了渐进损失(ProgLoss)与小目标感知标签分配(STAL);以及引入了用于稳定收敛的MuSGD优化器。
2026-05-12 15:03:01
537
windows下成功编译dcnv4环境
2024-06-18
基于YOLOv8的足球赛环境下足球目标检测系统
2024-06-18
基于YOLOV8的注意力机制源代码获取,开箱即用
2023-08-19
铝片缺陷数据集,数据集大小1400张,缺陷类型一共四种:zhen-kong、ca-shang、 zang-wu、 zhe-zho
2023-06-09
红外小目标飞机检测数据集
2023-05-07
基于yolov5的二维码识别
2023-04-30
基于分割的工业划痕质检数据集
2023-04-30
yolov1、yolov2、yolov3、yolov4、yolov5、yolov6、yolov7等论文
2023-04-28
三星油污缺陷类别:头发丝和小黑点, 数据集大小:660张
2023-04-28
玻璃瓶缺陷检测,缺陷类型:cap,数据集数量:125张
2023-04-28
二维码数据集,数据集大小1085张
2023-04-28
pyqt+yolov5+pcb缺陷检测
2023-04-01
yolov5 tensorrt c++部署
2023-03-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅