自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

B站 Ai学术叫叫兽的文案地

Ai学术叫叫兽的博客主要面向科研初学者,特别是计算机科学和人工智能领域的学生和研究者,分享如何从零开始撰写和发表SCI论文的实用经验与方法

  • 博客(335)
  • 收藏
  • 关注

原创 YOLOv13最新创新改进系列:与HorNet基于递归门控卷积的高效高阶空间交互融合,降低计算量的同时持续提升密集预测性能!!

本文提出递归门控卷积(gⁿConv)作为视觉Transformer中自注意力的高效替代方案。gⁿConv通过门控卷积和递归结构实现高阶空间交互,兼具输入自适应、长程建模能力和平移等变性。基于此构建的HorNet骨干网络在ImageNet分类、COCO检测和ADE20K分割任务中均优于Swin Transformer和ConvNeXt,最高达87.7%的ImageNet准确率。实验表明gⁿConv可扩展到任意阶空间交互,且计算复杂度可控。该工作为融合CNN与Transformer优势提供了新思路,相关代码已开

2026-04-26 19:51:05 3

原创 RT-DETR最新创新改进系列:与HorNet基于递归门控卷积的高效高阶空间交互融合,降低计算量的同时持续提升密集预测性能!!

本文提出了一种名为递归门控卷积(gⁿConv)的新型空间交互机制,通过门控卷积与递归结构实现高阶空间交互,构建了HorNet视觉骨干网络。gⁿConv具有高效性、可扩展性和平移等变性,能够在不显著增加计算量的情况下实现任意阶空间交互。实验表明,HorNet在ImageNet分类、COCO目标检测和ADE20K语义分割任务上性能显著优于Swin Transformer和ConvNeXt,同时展现出优异的可扩展性。该方法有效融合了视觉Transformer与CNN的优势,为视觉建模提供了新的基础模块。

2026-04-26 19:49:49 4

原创 RT-DETR最新创新改进系列:Involution新卷积网络算子融合于RT-DTER网络,从经典的图像滤波方法中汲取灵感,更大的空间范围中总结上下文信息,有效涨点!

RT-DETR网络引入Involution新卷积算子,通过反转传统卷积的空间不可知和通道特定特性,提出空间特定、通道不可知的新型操作。该算子从图像滤波方法中汲取灵感,能在更大空间范围聚合上下文信息,显著提升模型性能。实验表明,基于Involution的模型在ImageNet分类、COCO检测等任务上表现优异,计算成本压缩至57%-72%。该方法为视觉识别任务提供了新思路,同时简化了自注意力机制的复杂设计。详细实现包括YAML文件修改和任务脚本调整,验证后可获得明显性能提升。

2026-04-26 19:37:20 3

原创 RT-DETR最新创新改进系列:轻量级卷积LightConv,特征提取采用共享卷积核,采用更少的参数完成对RT-DTER网络的的轻量化创新设计,创新点神器!

RT-DETR最新改进系列提出轻量级卷积LightConv,通过共享卷积核显著减少参数数量,实现对RT-DETR网络的轻量化设计。该方法源自动态卷积(Dynamic Convolution)研究,能在保持模型性能的同时提升处理速度。创新亮点包括: 采用非自回归结构提高解码效率 利用VQWav2vec的矢量量化嵌入特征 动态卷积改进语音内容建模 实验显示模型参数减少约50%,解码速度提升8倍,在VCC2020任务中取得MOS 3.86和4.3%字符错误率的优异表现。该工作为轻量化目标检测网络提供了新思路,配套

2026-04-26 19:12:19 3

原创 RT-DETR最新创新改进系列:粉丝福利!!融合最新顶会提出的HCANet网络中MDCR注意力融合模块,有效提升小目标检测性能!

本文提出了一种改进的HCF-Net网络,通过融合PPA、DASI和MDCR三个模块,显著提升了红外小目标检测性能。PPA模块实现多尺度特征提取,DASI模块进行自适应通道选择融合,MDCR模块利用深度可分离卷积捕获不同感受野特征。在SIRST数据集上的实验表明,该方法优于现有技术,有效解决了小目标丢失和背景干扰问题。文章还提供了详细的模型修改步骤和训练方法,并配套B站视频教程。作者分享多项科研绘图代码工具,助力学术研究。该工作为目标检测领域提供了新的技术思路和实践方案。

2026-04-26 19:11:04 6

原创 YOLOv13最新创新改进系列:融合MobileOne模块,MobileOne,其变体在 iPhone12 上的推理时间低于 1 毫秒!!继续涨点、继续遥遥领先!

YOLOv13融合MobileOne模块实现高效目标检测。MobileOne是一种专为移动设备优化的神经网络骨干,在iPhone12上推理时间低于1毫秒,ImageNet top-1准确率达75.9%。该改进通过深度可分离卷积和点卷积构建MobileOneBlock模块,在保持精度的同时显著提升速度。实验表明,改进后的模型在图像分类、目标检测等任务中均实现SOTA性能,比EfficientNet在相同延迟下准确率提高2.3%,且计算效率提升38倍。代码实现了可部署的轻量级卷积结构,适用于移动端实时检测场景。

2026-04-26 18:42:25 13

原创 RT-DETR最新创新改进系列:融合MobileOne模块,MobileOne,其变体在 iPhone12 上的推理时间低于 1 毫秒!!继续涨点、继续遥遥领先!

摘要: 本文介绍了MobileOne模块在RT-DETR模型中的创新应用,该模块针对移动设备优化,在iPhone12上实现低于1毫秒的推理速度,同时保持高效性能(ImageNet top-1准确率75.9%)。MobileOne通过分析移动端神经网络的瓶颈,结合深度可分离卷积(DepthWiseConv)和点卷积(PointWiseConv),显著提升了模型效率。代码实现展示了模块的轻量化设计,支持动态重参数化(deploy模式)以加速推理。实验表明,MobileOne在图像分类、目标检测等任务中均优于现有

2026-04-26 18:41:02 16

原创 RT-DETR最新创新改进系列:融合最新顶会提出的HCANet网络中MSFN注意力融合模块,有效提升小目标检测性能!

这篇文章提出了一种名为HCANet的新型混合卷积和注意力网络,用于高光谱图像(HSI)去噪。该模型创新性地结合了CNN的局部特征提取能力和Transformer的全局上下文建模优势,通过卷积与注意力融合模块(CAFM)实现长程依赖性和邻域光谱相关性的捕获。特别设计了多尺度前馈网络(MSFN),采用并行扩张卷积提取不同尺度特征以提升去噪性能。实验结果表明,该模型能有效去除复杂噪声,在主流HSI数据集上优于现有方法。研究为HSI去噪提供了同时建模全局和局部特征的新思路,相关代码已开源。

2026-04-26 18:34:55 7

原创 RT-DETR最新创新改进系列:ODConv-全维度动态卷积通过并行策略采用多维注意力机制沿核空间的四个维度学习互补性注意力,有效涨点神器!!!

摘要: 本文介绍了全维度动态卷积(ODConv),一种通过并行策略和多维注意力机制改进CNN性能的创新方法。ODConv沿核空间的四个维度(数量、空间大小、输入/输出通道)学习互补注意力,显著提升模型精度(如ImageNet上MobileNetV2提升3.77%-5.71%)。实验表明,ODConv兼容轻量级和大型CNN,且单核性能媲美多核动态卷积。文章还提供了ODConv的YAML配置、代码修改及训练验证步骤,并附赠科研绘图工具与教程。作者为目标检测领域专家,提供一对一答疑服务。

2026-04-26 18:13:08 68

原创 图像增强技术代码免费送——此文是图像增强技术详解:雨水与雾气模拟算法!

本文详细介绍了两种图像增强技术:雾气模拟和雨水模拟算法。雾气增强基于大气散射物理模型,通过透射率和深度图模拟不同浓度的雾气效果。雨水增强则通过生成随机雨滴轨迹并应用运动模糊,模拟真实雨水场景。两种算法均可调节强度参数,为计算机视觉模型提供多样化的训练数据,提升在恶劣天气条件下的鲁棒性。实验结果表明,这些增强技术能有效模拟真实天气效果,为模型训练和评估提供可靠支持。

2026-04-26 18:06:39 32

原创 YOLOv13最新创新改进系列:结构重参化与yolo算法融合,改变传统卷积训练巨大的计算开销,实验表明ORPEA对于计算机视觉任务有独特的优越性!有效涨点!

本文介绍了YOLOv13的创新改进ORPEA(在线卷积重新参数化)技术,通过结构重参化与YOLO算法融合,显著降低了传统卷积训练的计算开销。实验表明该方法在计算机视觉任务中具有优越性,能减少70%训练内存消耗并提速2倍,同时在ImageNet上性能提升0.6%。文章还提供了目标检测和语义分割的实验结果,证明其在下游任务中的有效性。作者强调该技术可帮助科研工作者提升研究效率,并附有相关绘图代码和教程资源。

2026-04-25 17:56:23 5

原创 RT-DETR最新创新改进系列:结构重参化与yolo算法融合,改变传统卷积训练巨大的计算开销,实验表明ORPEA对于计算机视觉任务有独特的优越性!有效涨点!

本文介绍了一种新型在线卷积重参数化方法OREPA,通过结构重参化与YOLO算法融合,有效降低传统卷积训练的计算开销。该方法采用两阶段流水线设计,将复杂训练块压缩为单个卷积层,结合线性缩放层优化模型性能。实验表明,OREPA在ImageNet任务上提升0.6%准确率的同时,减少70%训练内存消耗,提速2倍,并在目标检测等下游任务中保持优势。研究还探讨了增强重参数化的组件设计,为计算机视觉任务提供了更高效的解决方案。

2026-04-25 17:55:28 53

原创 重磅更新:史诗级操作!我们隆重推出YOLO算法与K折交叉验证的集成方案。这一组合充分利用K折交叉验证的稳定性优势,对YOLO模型进行极致优化与科学验证,能显著提升研究成果的泛化能力和说服力!

本文介绍了YOLO算法与K折交叉验证的集成方案,通过将数据集划分为K个互斥子集,依次进行训练和验证,显著提升模型评估的稳定性和泛化能力。特别针对目标检测任务,强调以图片为单位划分数据并保持类别分布均衡。详细展示了5折交叉验证的完整流程,包括数据划分、训练验证轮次及最终性能评估方法(取K次mAP均值±标准差)。文末提供了代码获取方式和训练指令,适用于从头训练或迁移学习场景,并附赠多种科研绘图工具资源。该方案能有效降低数据划分偏差,但需权衡计算成本,最终需用全数据重新训练部署模型。

2026-04-25 17:54:29 86

原创 Sci精读:优秀论文必读推荐!!!昆虫-YOLO:一种新型作物害虫检测方法

害虫监测报告系统已被广泛用于实现田间害虫自动化监测,成为替代耗时费力的人工调查方法的有效方案。然而,作物害虫存在光谱异质性和尺寸变异性,且在实际农业场景中,为控制相机镜头成本,常导致图像分辨率较低,这极大增加了害虫识别的复杂性。本研究聚焦低分辨率图像中的害虫检测,从农田采集了大量常见害虫低分辨率图像(分辨率范围为800万-1200万像素),并基于该数据集构建了Insect-YOLO模型。该模型专为多种作物的害虫检测设计,具有参数精简、检测速度快、准确率高的特点。通过集成卷积块注意力模块(CBAM)

2026-04-25 17:52:12 107

原创 YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),融合HCF-NET网络中的DASI模块,红外小目标实验证明针对小目标的改进具有出色表现!

本文介绍了一种改进的YOLOv11多模态目标检测方法,通过融合RGB和红外(IR)图像,并集成HCF-Net网络中的DASI模块,显著提升了小目标检测性能。文章提供了完整的M3FD数据集配置方案,详细说明了YAML文件修改、Python代码实现和任务文件调整的具体步骤。实验结果表明,该方法在红外小目标检测任务中表现优异,特别针对微小物体(仅含几个像素)的识别具有显著优势。作者还分享了相关绘图工具和科研资源,并提供了B站视频教程和源码获取渠道。该研究为计算机视觉领域的小目标检测提供了有效的解决方案。

2026-04-25 17:44:57 281

原创 YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),针对管状结构分割的动态卷积创新,其在多个公开和私有数据集上进行了验证,表现出色。

Dynamic Snake Convolution(动态蛇形卷积,简称DSConv或DSC)是一种专为管状结构分割(如血管、道路等)设计的卷积神经网络模块。它通过模仿蛇的蜿蜒运动,使卷积核能够自适应地沿管状结构的中心线滑动,有效增强对细长、弯曲且脆弱的局部结构的特征提取能力。该方法由Qi等人在ICCV 2023上提出,旨在解决传统卷积在处理管状结构时容易丢失细节、导致分割断裂的问题。

2026-04-25 17:41:49 257

原创 YOLOv11最新创新改进系列:双卷积核(DualConv)结合了 3×3 和 1×1 卷积核来同时处理相同的输入特征图通道,旨在构建轻量级深度神经网络,目标检测YOLOv11有效涨点神器!!

YOLOv11最新改进:双卷积核(DualConv)技术详解 摘要:本文介绍了YOLOv11目标检测模型中的创新改进——双卷积核(DualConv)技术。该技术结合3×3和1×1卷积核同时处理输入特征图,有效降低了网络计算成本和参数数量(MobileNetV2参数减少54%),同时保持甚至提高了模型精度(YOLO-V3在PASCAL VOC上准确率提升4.4%)。文章提供了完整实现方案,包括数据集配置(M3FD.yaml)、代码修改步骤和验证方法,支持可见光与红外图像的多模态处理。实验结果表明,DualCo

2026-04-25 17:39:28 212

原创 YOLOv11最新创新改进系列:多模态融合RGB+红外线(IR),加入新型高效的多尺度注意力(EMA)模块保留每个通道的信息并减少计算成本!助力v11检测性能遥遥领先!

YOLOv11最新改进系列引入多模态融合技术,结合RGB与红外(IR)图像数据,并集成新型高效多尺度注意力(EMA)模块。EMA通过保留通道信息和降低计算成本,显著提升了目标检测性能。该改进支持40+单模态和20+多模态组合方案,配置了开箱即用的M3FD数据集模板。实验表明,EMA在ImageNet-1k和COCO等基准测试中,以较低计算复杂度实现了优于现有注意力机制的性能。改进方案已开源,包含详细教程和持续更新的工具支持。

2026-04-25 16:40:07 236

原创 数据集:VOC2007数据集详细介绍以及VOC(xml)转化YOLO(txt)格式工具的分享以及使用教程!家人们独享!

本文详细介绍了VOC2007数据集,这是一个计算机视觉领域的经典数据集,包含9,963张图像和24,640个标注对象,涵盖20个类别。文章解析了数据集结构、标注格式(XML)及其在目标检测、分类和分割任务中的应用,并提供了数据统计代码示例。此外,还分享了将VOC格式转换为YOLO格式的工具和使用教程。作为目标检测领域的经典基准,VOC2007虽已被COCO等新数据集取代,但其高质量标注和标准化评估仍具重要参考价值。文末还提供了多种科研绘图工具的免费资源。

2026-04-25 16:38:29 371

原创 YOLO数据集随机划分工具分享以及原理详解

本文介绍了一个用于随机划分YOLO格式数据集的Python工具。该工具可将原始数据集按6:2:2比例划分为训练集、验证集和测试集,并自动创建规范的目录结构。核心算法包括文件匹配、随机打乱、比例计算和完整性验证,确保图像与标注文件对应。工具支持多格式图像文件,输出包含详细统计信息,适用于深度学习模型训练的数据准备。划分时需注意文件完整性、比例调整和存储空间等事项。

2026-04-25 16:29:09 227

原创 数据处理:大家庭的小伙伴免费领!!批量图片压缩工具,让你的训练速度(炼丹速度)直接起飞!一天完成一月实验量!

这篇技术文章详细介绍了一款基于Python的批量图片压缩工具,主要面向科研人员和开发者群体。文章从压缩原理、技术实现到操作指南进行了全面阐述,核心内容包括: 工具基于Pillow库实现,支持JPEG/PNG等多种格式,通过调整编码参数实现高效压缩 详细解析了JPEG的DCT变换和PNG的DEFLATE算法等核心技术原理 提供完整的操作流程,包括环境配置、参数设置和质量建议 强调工具的实用价值:可显著提升图像处理效率,节省存储空间 文章最后还附赠其他科研绘图工具的免费资源,体现作者的技术分享精神 该工具特别适

2026-04-24 17:19:45 18

原创 YOLOv13最新创新改进系列:无参数平均注意力PfAAM——性能瓶颈与模块互补需求,更加关注目标区域,抑制无关背景,从而提升 mAP(平均精度)

摘要: 本文提出一种无参数平均注意力模块(PfAAM),通过空间和通道维度的平均操作增强卷积神经网络的注意力机制,无需增加模型参数或计算负担。PfAAM可即插即用集成到各类网络架构中,在分类和语义分割任务中显著提升性能。实验表明,基于平均池化的PfAAM在CIFAR-10等数据集上优于传统注意力方法,且保持轻量化特性,适用于实时目标检测(如YOLO系列)。该模块通过抑制背景噪声、突出关键区域,有效提升模型精度(如ResNet-164错误率降低至4.76%),同时兼容现有网络结构,为计算机视觉任务提供了一种高

2026-04-24 17:16:04 119

原创 YOLOv13最新创新改进系列:深度乘数+PixelUnShuffle增强深度卷积的特征表达能力的同时提高GPU并行效率,2025年最新创新!嘎嘎领先!!!

本文提出PRNet框架,针对航拍影像小目标检测中的特征丢失问题,创新性地设计了渐进式细化颈部(PRN)和增强型切片采样(ESSamp)两大模块。PRN通过多阶段骨干特征复用和渐进式融合策略,有效保留浅层高分辨率特征;ESSamp结合深度乘数和PixelUnShuffle技术,在降采样过程中显著提升细节保留能力与GPU并行效率。实验表明,该方法在VisDrone等主流数据集上实现SOTA性能,在保持高效计算的同时大幅提升小目标检测精度,为资源受限的边缘设备部署提供了优质解决方案。

2026-04-24 17:11:44 131

原创 YOLOv13最新创新改进系列:高阶创新-二次创新,手搓原创性模块,手把手教程!ESSamp+GhostConv构建高性能的轻量级密集预测网络模块!

应用场景轻量级图像超分辨率网络实时检测模型(如车载、移动端检测)资源受限的图像到图像转换任务任何需要在嵌入式设备上运行且包含上采样步骤的密集预测模型。核心价值ESSamp+GhostConv的组合,是在网络的上采样路径上实现“多快好省”的经典策略。它在大幅度降低计算复杂度和参数量的同时,通过智能的结构设计(特征冗余利用+可学习高效上采样)尽可能保持甚至增强了特征表达能力,使得在有限的计算预算下获得更具竞争力的精度成为可能。

2026-04-24 17:10:25 131

原创 YOLOv13最新创新改进系列:独家原创二次创新!C2f超强改进,设计全新C2f-PfAAM,有效涨点的同时更注重效率的均衡,附带所有模块图表,助力高水平期刊发表!

本文介绍了YOLOv13中的创新改进C2f-PfAAM模块,通过引入无参数平均注意力机制(PfAAM)对原有C2f结构进行优化。改进后的模块具有双重注意力机制、增强的规范化和激活函数,在保持轻量化的同时显著提升特征表征能力。实验表明,该模块使检测精度提高3-5%,训练稳定性增强,尤其适合复杂场景。虽然计算量增加20-30%,但在精度与效率间取得了更好平衡,为轻量级目标检测网络的设计提供了新思路。该改进已在实际应用中验证有效,相关代码和教程已在B站公开。

2026-04-24 17:09:12 266

原创 YOLOv13最新改进创新系列:高阶创新——如何手搓自己的原创性注意力模块!二次、三次orN次创新模块?最简洁明了的教程来了!!!包教包会!!

本文介绍了如何结合CBAM注意力模块和AKConv动态卷积进行YOLOv13的改进创新。CBAM通过通道和空间注意力机制实现自适应特征选择,AKConv则通过灵活可变的卷积核结构增强空间建模能力。两者协同工作可构建更强大的特征提取器:AKConv负责粗粒度结构提取,CBAM进行细粒度特征优化。这种组合在目标检测、分割等任务中表现出色,能以较小的参数增量显著提升模型性能。文章还提供了详细的模块实现教程和相关代码资源,适合科研人员参考改进自己的视觉模型。

2026-04-24 17:06:02 152

原创 YOLO26最新创新改进系列:独家原创二次创新!C2f超强改进,设计全新C2f-PfAAM,有效涨点的同时更注重效率的均衡,附带所有模块图表,助力高水平期刊发表!

本文提出了一种改进的C2f-PfAAM模块,通过引入无参数平均注意力机制(PfAAM)对YOLO26中的C2f结构进行二次创新。该模块采用双阶段注意力机制,同时考虑通道和空间维度,在仅增加少量参数的情况下实现特征重校准。改进还包括增强的规范化与激活层,以及自定义Bottleneck结构。实验表明,C2fPfAAM在适度增加20-30%计算量的情况下,检测精度(mAP)提升3-5%,训练稳定性显著提高,复杂场景适应能力大幅增强。该工作为轻量级CNN与注意力机制融合提供了新思路,平衡了效率与性能。作者还提供了详

2026-04-24 17:04:45 274

原创 YOLO26最新创新改进系列:独家原创二次创新!C2f超强改进,设计全新C2f-PfAAM,有效涨点的同时更注重效率的均衡,附带所有模块图表,助力高水平期刊发表!

本文提出了一种改进的C2f-PfAAM模块,通过引入无参数平均注意力机制(PfAAM)对YOLO26中的C2f结构进行二次创新。该模块采用双阶段注意力机制,同时考虑通道和空间维度,在仅增加少量参数的情况下实现特征重校准。改进还包括增强的规范化与激活层,以及自定义Bottleneck结构。实验表明,C2fPfAAM在适度增加20-30%计算量的情况下,检测精度(mAP)提升3-5%,训练稳定性显著提高,复杂场景适应能力大幅增强。该工作为轻量级CNN与注意力机制融合提供了新思路,平衡了效率与性能。作者还提供了详

2026-04-24 17:00:15 318

原创 YOLO26最新创新改进系列:融合HCF-NET网络中的DASI模块,维度感知选择性集成,实验证明针对小目标的改进具有出色表现!

本文提出了一种改进的HCF-Net网络用于红外小目标检测,通过融合DASI模块实现维度感知选择性集成。该网络包含PPA模块(多尺度特征提取)、DASI模块(自适应通道融合)和MDCR模块(多感受野特征捕获),有效解决了小目标丢失和背景干扰问题。在SIRST数据集上的实验表明,该方法优于传统和深度学习模型。文章还提供了详细的代码修改步骤和训练方法,并附有可视化结果展示。作者强调该方法可显著提升红外小目标检测性能,特别适合科研人员参考使用。

2026-04-24 16:52:41 281

原创 YOLOv26最新创新改进系列:YOLO26主干改进-华为诺亚提出全新骨干架构VanillaNet,YOLO融合深度学习极简主义的力量,大力提升模型鲁棒性!!

华为诺亚团队提出极简神经网络架构VanillaNet,通过摒弃深度网络中的复杂结构(如shortcuts、自注意力等),仅保留基础卷积层,实现高效推理。该架构采用1×1卷积核和训练后剪裁激活函数,在保持性能的同时大幅降低计算复杂度。实验表明VanillaNet与主流深度网络和Vision Transformer性能相当,为资源受限场景提供新选择。研究团队还展示了将VanillaNet作为YOLOv26骨干网络的改进方案,包括YAML配置和代码修改方法。这项工作体现了深度学习领域"少即是多&quot

2026-04-24 16:52:23 319

原创 YOLO26全网最新创新点改进系列:融入AKConv(可改变核卷积),加强特征提取,任意数量的参数和任意采样形状,为网络开销和性能之间的权衡提供了更丰富的选择。 拉升检测性能!

摘要: YOLO26最新改进系列引入AKConv(可变核卷积),突破传统卷积限制,支持任意参数数量和采样形状,显著提升特征提取能力。AKConv通过动态调整采样形状适应目标变化,提供更灵活的核选择,在COCO2017等数据集上验证了其优势。相比传统卷积,AKConv参数增长更平缓(线性vs平方),兼顾性能与计算效率,可作为即插即用模块增强网络表现。该创新为计算机视觉任务提供了更丰富的卷积解决方案,尤其适合目标检测等需适应多变物体形状的场景。

2026-04-23 22:58:31 26

原创 YOLO26全网最新创新点改进系列:引入BiFPN网络可学习的权重来学习不同输入特征的重要性,同时重复应用自上而下和自下而上的多尺度特征融合.,亲测显著涨点!

本文介绍了YOLO26目标检测模型的最新改进——引入BiFPN网络。BiFPN通过可学习权重机制实现高效的双向跨尺度连接和加权特征融合,解决了多尺度特征表示的难题。相比传统FPN、PANet和NAS-FPN,BiFPN在准确性和效率间取得了更好平衡。文章提供了详细的改进教程,包括YAML文件修改、新建.py文件和tasks.py修改等步骤,并附有验证方法。作者还分享了丰富的科研绘图资源,强调个性化指导对科研工作的重要性。该改进方案经实测能显著提升模型性能,为目标检测领域的研究提供了新的技术思路。

2026-04-23 22:57:18 75

原创 YOLO26全网最新创新点改进系列:免费送!!!改进且跑通的源码!!融入CBAM注意力,将通道注意力和空间注意力相结合,嘎嘎提升YOLO算法,叫叫首,改进速度遥遥领先,粉丝水文速度遥遥领先!!!

摘要: 本文介绍了YOLO26算法的创新改进方案,通过融入CBAM注意力机制(通道+空间注意力)显著提升模型性能。CBAM模块通过全局池化、全连接层和Sigmoid激活,自适应加权特征图,增强关键信息捕捉能力。改进后的源码已开源,支持一键训练验证。作者提供免费科研工具及绘图代码(附教程),并承诺为购买资料者提供一对一答疑服务。关注"AI学术叫叫兽"可获取持续更新的资源,助力科研效率提升。

2026-04-23 22:56:14 115

原创 YOLO26全网最新创新点改进系列:免费送!!!改进且跑通的源码!!通过增加检测层来提高对小目标特征信息的提取能力,旨在提升YOLO26模型的小目标、密集型目标的检测精度!!!

本文介绍了一种改进YOLOv11目标检测算法的方法,通过增加检测层来提升对小目标和密集型目标的检测精度。针对小目标检测中存在的漏检和效果不佳问题,该方法增强了特征提取能力。作者免费提供已跑通的改进源码,用户只需执行简单命令即可验证效果。此外,还提供多种科研绘图工具和详细教程,帮助提升论文质量。作者作为有丰富科研经验的目标检测专家,承诺为读者提供一对一答疑服务。文末展示了多种科研绘图效果图,所有资源可通过关注作者获取持续更新。

2026-04-23 22:54:23 19

原创 YOLO26全网最新创新点改进系列:受到哺乳动物大脑神经科学理论的启发,融合空间信息关注机制(SimAM)于YOLO26网络,在通道之间和空间位置之间建立更加准确的关联,助力YOLO有效涨点

本文提出了一种受神经科学启发的注意力模块SimAM,通过能量函数优化实现3D注意力权重计算,无需额外参数。该方法在YOLO26网络中融合空间信息关注机制,显著提升目标检测性能。SimAM模块基于哺乳动物大脑的空间抑制理论,推导出封闭式解决方案,计算效率高。实验表明,该模块能有效增强卷积神经网络的表示能力,在多种视觉任务中优于现有注意力方法。文章还提供了详细的代码实现和训练指南,方便研究者复现和应用。

2026-04-23 22:49:55 277

原创 YOLO26全网最新创新点改进系列:超越VIT!大型可分离核注意力(LSKA)重新思考CNN大核注意力设计,提升小目标检测性能!新上加强-助力创新点更优!

本文提出了一种新型大型可分离核注意力模块(LSKA),通过将2D卷积核分解为级联的1D水平核和垂直核,显著降低了视觉注意力网络(VAN)的计算复杂度和内存占用。实验表明,LSKA在保持与标准LKA模块相当性能的同时,能够有效处理超大卷积核(35×35至53×53),并增强模型对物体形状而非纹理的偏好。在图像分类、目标检测和语义分割任务中,基于LSKA的VAN超越了ViTs和ConvNeXt等模型,同时展现出更强的鲁棒性。该研究为CNN大核设计提供了新的思路,解决了传统方法在计算效率方面的瓶颈问题。

2026-04-23 22:47:59 270

原创 YOLO26最新创新改进系列::改进加入新型高效的多尺度注意力(EMA)模块保留每个通道的信息并减少计算成本!助力YOLO检测性能快速涨点!

本文提出了一种新型高效的多尺度注意力模块(EMA),通过保留通道信息和减少计算成本来提升YOLO检测性能。EMA模块将通道维度分组为多个子特征,通过跨维度交互聚合两个并行分支的输出特征,从而捕获像素级关系。实验表明,EMA在CIFAR-100、ImageNet-1k、MS COCO等基准测试中表现优异,相比现有注意力方法具有更高的准确率和更低的计算复杂度。该模块可灵活应用于各类计算机视觉任务,显著增强特征表示能力。文章还详细介绍了EMA在YOLO模型中的具体实现步骤,为相关研究提供了实用参考。

2026-04-23 22:42:54 290

原创 YOLO26最新创新改进系列:融合HCF-NET网络中的DASI模块,维度感知选择性集成,实验证明针对小目标的改进具有出色表现!

本文提出了一种改进红外小目标检测的HCF-Net网络,通过三个创新模块显著提升性能:并行补丁感知注意(PPA)模块实现多尺度特征提取,维度感知选择性集成(DASI)模块实现自适应通道融合,多扩张通道细化器(MDCR)模块扩展感受野。实验表明,该方法在SIRST数据集上优于现有技术,有效解决了小目标丢失和背景干扰问题。文章还提供了详细的模型改进教程和代码资源,并附赠多种科研绘图工具。

2026-04-23 22:40:35 282

原创 YOLO26最新创新改进系列:FDConv 频域动态卷积模块,通过频域学习动态生成卷积核权重,并融合多种注意力机制,有效提升YOLO26性能,嘎嘎创新!

摘要:FDConv是一种创新的频域动态卷积模块,通过频域学习动态生成卷积核权重,并融合多种注意力机制。相比传统静态卷积,FDConv在频域构建卷积权重,实现高频率多样性和细粒度调制,同时保持参数高效性。其核心创新包括傅里叶不相交权重、核空间调制和频带调制等技术。在YOLO目标检测中应用FDConv可显著提升小目标和边界检测精度,同时保持轻量化和实时性优势,是平衡速度与精度的理想卷积替代方案。该模块可直接替换YOLO中的传统卷积层,无需修改网络结构。

2026-04-23 22:27:35 511

原创 YOLO26最新创新改进系列:叫叫兽独家创新,二次创新——全新MBConv-PAMBConv:「YOLO-P²AM:可学习上采样与注意力卷积双核驱动,小目标检测精度破限」!!

本文介绍了YOLO26的创新改进方案"YOLO-P²AM",通过融合PixelShuffle上采样与轻量级注意力卷积,提出PatchExpand和PAMBConv两个核心模块。PatchExpand实现可学习的上采样,避免传统插值导致的细节丢失;PAMBConv集成深度卷积与注意力机制,增强特征表达能力。二者协同工作,显著提升了小目标检测精度,且无需额外调参即可直接替换原YOLO模块。该方法有效解决了传统YOLO在上采样和特征融合中的细节丢失、计算冗余等问题,为实时目标检测提供了新的技术

2026-04-23 16:34:44 385

批量图片压缩工具-B站:Ai学术叫叫兽同款

批量图片压缩工具——B站:Ai学术叫叫兽同款 一键操作! 训练提速!!!

2025-11-10

VOC格式(xml)数据集转换yolo(txt)代码,一键操作

代码都是测试过没问题的! 视频教程:关注B站 Ai学术叫叫兽 保姆教程手把手操作,一键操作!

2025-11-05

VOC2007数据集-目标检测经典数据集之一!

VOC2007数据集详细介绍 VOC2007(PASCAL Visual Object Classes 2007)是计算机视觉领域一个里程碑式的数据集,对目标检测、图像分类、语义分割等任务的发展产生了深远影响。 数据集概述 全称:PASCAL Visual Object Classes 2007 发布时间:2007年 主要用途:目标检测、图像分类、目标分割 数据规模:9,963张图像,24,640个标注对象

2025-11-05

图像增强技术代码免费送-雨水与雾气模拟算法,关注CSDN博主:Ai棒棒牛

在计算机视觉领域,数据增强是提高模型泛化能力的关键技术。特别是对于目标检测任务,模型需要在各种天气条件下保持稳定的性能。雨水和雾气作为常见的恶劣天气条件,会显著影响图像质量,从而降低模型性能。 研究意义: 提高YOLO等目标检测模型在恶劣天气下的鲁棒性 解决真实世界中数据采集成本高、场景有限的问题 为模型评估提供更多的测试场景

2025-10-29

B站叫叫兽粉丝专属-YOLOv11改进免费送

B站叫叫兽粉丝专属-YOLOv11改进免费送 ! YOLOv11全网最新创新点改进系列:免费送!!!改进且跑通的源码!!融入CBAM注意力,将通道注意力和空间注意力相结合,嘎嘎提升V11算法,叫叫首,改进速度遥遥领先,粉丝水文速度遥遥领先!!! YOLOv11全网最新创新点改进系列:免费送!!!改进且跑通的源码!!通过增加检测层来提高对小目标特征信息的提取能力,旨在提升YOLOv11模型的小目标、密集型目标的检测精度!!!

2024-10-12

植物病虫害数据集 免费下载

植物病虫害数据集 免费下载

2023-09-08

数据集标注教程详细版,关注B站博主:AI学术叫叫兽

数据集标注教程详细版,关注B站博主:AI学术叫叫兽

2023-09-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除