- 博客(102)
- 资源 (1)
- 收藏
- 关注
原创 深入浅出Batch Size,对模型训练的影响分析
训练神经网络以最小化以下形式的损失函数:theta 代表模型参数m 是训练数据样本的数量i 的每个值代表一个单一的训练数据样本J_i 表示应用于单个训练样本的损失函数通常,这是使用梯度下降来完成的,它计算损失函数相对于参数的梯度,并在该方向上迈出一步。随机梯度下降计算训练数据子集 B_k 上的梯度,而不是整个训练数据集。
2024-11-02 22:11:50 1244
原创 超越YOLO11、RT-DETRv2/3!中科大D-FINE重新定义边界框回归任务
在 COCO 数据集上,D-FINE-L 和 D-FINE-X 分别以 8.07 ms (124 FPS) 和 12.89 ms (78 FPS) 的时延取得了 54.0% 和 55.8% 的 AP,远超其余所有实时目标检测器,打败了 YOLOv10 (53.2%,54.4%)、YOLO11 (53.4%,54.7%) 及 RT-DETRv2 (53.4%,54.6%)。特别是对于计算资源有限的小型团队,即使是精妙的训练策略,若缺乏大规模的超参数搜索,也难以取得预期的效果。
2024-10-31 22:18:52 872
原创 超越 YOLOv8,MAF-YOLO利用重参化异构卷积大幅度提升多尺度信息融合能力!
由于多尺度特征融合的有效性能,路径聚合FPN(PAFPN)被广泛应用于YOLO检测器中。然而,它不能同时高效且自适应地融合高级语义信息与低级空间信息。本文提出了一种名为MAF-YOLO的新模型,这是一个具有多功能 Neck 网络的新颖目标检测框架,名为多分支辅助FPN(MAFPN)。在MAFPN中,设计了表面辅助融合(SAF)模块,以将 Backbone 网络的输出与 Neck 网络相结合,保留适量的浅层信息以促进后续学习。
2024-10-30 22:58:46 999
原创 YOLO11来啦 | 详细解读YOLO11的改进模块!
2024年可谓是YOLO历史性的一年,9月份的最后一天迎来了YOLO2024年的第三部巨作。2024年2月21日,继 2023 年 1 月 YOLOv8 正式发布一年多以后,YOLOv9 才终于到来了!YOLOv9提出了可编程梯度信息(Programmable Gradient Information,PGI)的概念,我们可以用它来获取完整的信息,从而使从头开始训练的模型能够比使用大型数据集预训练的 SOTA 模型获得更好的结果。
2024-10-19 23:42:59 2990
原创 深度学习之回归
总结来说对于低阶函数来说,损失主要来自偏差,而高阶函数的损失主要来自偏差。低阶函数的拟合能力有限,因此带来的问题称为欠拟合(underfitting),而高阶函数由于过于地powerful,从而容易带来过拟合(overfitting)的问题:偏差vs方差应对大的偏差的方法:①增加更多特征作为输入②使用更复杂的模型应对大的方差的方法:①更多数据②正则化。
2024-10-14 23:18:47 926
原创 优化改进YOLOv5算法之Shift-ConvNets,具有大核效应的小卷积核,效果提升明显
最近的研究表明,Vision transformers (ViTs)的卓越性能得益于大的感受野。因此,大型卷积核设计成为使卷积神经网络(CNNs)再次变得出色的理想解决方案。然而,典型的大的卷积核被证明是对硬件不友好的操作,导致与各种硬件平台的兼容性降低。因此,简单地增大卷积核的大小是不明智的。在本文中,我们揭示了小型卷积核和卷积操作可以实现大型内核大小的封闭效果。然后,我们提出了一种shift-wise操作,该操作借助稀疏机制确保CNN捕获长距离依赖关系,同时保持对硬件的友好性。
2024-06-19 23:15:06 310
原创 YOLOv9来啦!YOLO目标检测全新工作!性能表现SOTA!在各个方面都大大超过了RT-DETR、YOLOv8等
今天的深度学习方法侧重于如何设计最合适的目标函数,使模型的预测结果最接近实际情况。同时,必须设计一种适当的架构,该架构可以促进获取足够的信息用于预测。现有的方法忽略了一个事实,即当输入数据经过逐层特征提取和空间变换时,会丢失大量信息。本文将深入研究数据通过深度网络传输时数据丢失的重要问题,即信息瓶颈和可逆函数。我们提出了可编程梯度信息(PGI)的概念,以应对深度网络实现多个目标所需的各种变化。PGI可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权重。
2024-02-22 13:56:22 19153 18
原创 ADA-YOLO:YOLOv8+注意力+Adaptive Head,mAP提升3%
生物医学图像分析中的目标检测和定位至关重要,尤其是在血液学领域,检测和识别血细胞对于诊断和治疗决策至关重要。虽然基于注意力的方法在各个领域中目标检测方面取得了显著的进展,但由于医学影像数据集的独特挑战,其在医学目标检测中的应用受到了限制。为了解决这个问题,作者提出了一种名为ADA-YOLO的轻量级但有效的医学目标检测方法,该方法将注意力机制与YOLOv8架构相结合。作者提出的这种方法通过自适应头模块利用动态特征定位和并行回归进行计算机视觉任务。
2024-01-16 23:00:21 2346 3
原创 优化改进YOLOv5算法之Deformable Attention,有效提升检测效果,秒杀SE、CBAM和CA等注意力机制
对于 Attention 中的多个端口来说,首先将这些端口分为一定的组,比如 24 个端口 6 组,那么每组的 4 个端口将共享同一种位置偏差,使用的预测维度即分配给这 4 个端口的维度,不同组预测的位置偏差将不一样。最后还会加上一个相对位置插入,正常情况下这个位置矩阵大小为 �(2�−1)×(2�−1) ,但是考虑到存在处于任意位置的偏差,这个位置矩阵依然会做一个连续的差值 (Relative Displacements) 真尴尬我不知道这个英文我理没理解对......
2024-01-11 22:46:05 746
原创 优化改进YOLOv5算法之Dilation-wise Residual(DWR)可扩张残差注意力模块,增强多尺度感受野特征,助力小目标检测
因此,在网络阶段4中,设置扩张率为1、3和5的扩张卷积的3个分支,而在阶段3中,放弃第三个分支以挤压感受野以避免有效计算。此外,由于卷积在更大的空间跨度上直接建立连接总是更困难,并且大跨度连接需要小跨度连接的帮助,因此在每个阶段,小的感受野总是很重要的。事实上,在第二步中,根据感受野的大小,可以在第一步中明智地学习所需的简明区域特征图,以反向匹配感受野。作者认为,确定合适的感受野大小对于提高特征提取的效率至关重要,并且在网络的不同阶段对感受野大小的要求是不同的。具体来说,所有特征图都是串联的。
2024-01-10 23:03:19 1116
原创 优化改进YOLOv8算法之AKConv(可改变核卷积),即插即用的卷积,效果秒杀DSConv
基于卷积运算的神经网络在深度学习领域取得了令人瞩目的成果,但标准卷积运算存在两个固有的缺陷。一方面,卷积运算仅限于局部窗口,无法捕获其他位置的信息, 并且它的采样形状是固定的。另一方面,卷积核的大小固定为k×k,是一个固定的正方形,参数的数量往往随大小呈平方增长。很明显,不同数据集和不同位置的目标的形状和大小是不同的。
2024-01-09 22:18:12 7406 15
原创 优化改进YOLOv5算法之AKConv(可改变核卷积),即插即用的卷积,效果秒杀DSConv
基于卷积运算的神经网络在深度学习领域取得了令人瞩目的成果,但标准卷积运算存在两个固有的缺陷。一方面,卷积运算仅限于局部窗口,无法捕获其他位置的信息, 并且它的采样形状是固定的。另一方面,卷积核的大小固定为k×k,是一个固定的正方形,参数的数量往往随大小呈平方增长。很明显,不同数据集和不同位置的目标的形状和大小是不同的。
2024-01-08 22:55:51 1645
原创 YOLOv5+混合注意力机制再涨4.3%,Transformer混合设计依旧可以卷
在工业生产过程中,由于低效率、不统一的评估、高成本以及缺乏实时数据,传统的手动检测焊接缺陷不再被应用。为了解决表面贴装技术中焊接缺陷检测的低准确率、高误检率和计算成本问题,提出了一种新方法。该方法是一种专门针对焊接缺陷检测算法的混合注意力机制,通过增加准确度并降低计算成本来提高制造过程中的质量控制。混合注意力机制包括提出的增强多头自注意力机制和协调注意力机制,以增加注意力网络感知上下文信息的能力,并提高网络特征利用率。协调注意力机制增强了不同通道之间的连接,减少了位置信息损失。
2024-01-06 22:28:39 2375
原创 目标检测损失函数:IoU、GIoU、DIoU、CIoU、EIoU、alpha IoU、SIoU、WIoU原理及Pytorch实现
IoU全称Intersection over Union,交并比。IoU是一种测量在特定数据集中检测相应物体准确度的一个标准。只要是在输出中得出一个预测范围(bounding boxes)的任务都可以用IoU来进行测量。IoU算法是使用最广泛的算法,大部分的检测算法都是使用的这个算法。在目标识别中,我们的预测框与实际框的某种比值就是IoU。1.2 IoU计算公式通过上述分析,当预测框和真实框不相交时IoU值为0,导致很大范围内损失函数没有梯度。针对这一问题,提出了GIoU作为损失函数。
2023-12-28 23:05:15 4930 2
原创 ASF-YOLO开源 | SSFF融合+TPE编码+CPAM注意力,精度提升!
作者提出了一种新颖的注意力尺度序列融合基于YOLO框架(ASF-YOLO),该框架结合了空间和尺度特征,以实现精确快速的细胞实例分割。在YOLO分割框架的基础上,作者采用了尺度序列特征融合(SSFF)模块来增强网络的多尺度信息提取能力,并采用三特征编码器(TPE)模块将不同尺度的特征图进行融合,以增加详细信息。作者进一步引入了一种通道和位置注意力机制,以将SSFF和TPE模块集成起来,专注于具有信息量大、位置相关的较小目标,以提高检测和分割性能。
2023-12-14 23:06:09 6386
原创 优化改进YOLOv5算法之感受野注意力卷积运算(RFAConv),效果秒杀CBAM和CA等
但是,。在论文中,作者对空间注意力的有效性提出了一个新的观点,即。然而,由空间注意力生成的注意力图中包含的信息。因此,,如卷积块注意力模块(CBAM)和协调注意力(CA),只关注空间特征,并没有完全解决卷积核参数共享的问题。由RFA开发的(RFAConv)。作者在ImageNet-1k、COCO和VOC数据集上进行了一系列实验,以证明他们的方法的优越性。特别重要的是,
2023-11-14 23:07:06 1375
原创 全新Inner-IoU损失函数!!!通过辅助边界框计算IoU有效提升检测效果
随着检测器的快速发展,边界框回归(BBR)损失函数不断进行更新和优化。然而,现有的 IoU 基于 BBR 仍然集中在通过添加新损失项来加速收敛,忽略了 IoU 损失项本身的局限性。尽管从理论上讲,IoU 损失可以有效地描述边界框回归的状态,但在实际应用中,它无法根据不同的检测器和检测任务进行自适应调整,且不具备较强的泛化能力。基于上述情况,作者首先分析了 BBR 模型,并得出结论:区分不同的回归样本以及使用不同尺度的辅助边界框计算损失可以有效加速边界框回归过程。
2023-11-10 23:45:00 3708 1
原创 YOLOv5-6.1源码详解之损失函数loss.py
如下图所示,人、大巴为检测目标,既要检测出所有人和大巴的位置,也要检测出包围人和大巴的最小矩形框,同时还要识别出哪个矩形框内是人,哪个矩形框内是大巴。
2023-11-09 23:42:27 4363 2
原创 优化改进YOLOv5算法之添加DCNv3模块,有效提升目标检测效果
拿到文章之后先看了一眼在ImageNet1k上的结果,确实很高,超越了同等大小下的VAN、RepLKNet、ConvNext等先进的大核注意力CNN模型,同时也超过了Swin、DeiT3、CoAtNet等ViT模型。回顾自从Vision Transformer被提出之后,通过大量数据训练出的ViT大模型刷新了许多视觉任务的记录,这得益于ViT的MHSA机制能够建模长距离依赖,具有相当低的归纳偏置,从而能够在海量数据中学习到强大鲁棒的特征表达。
2023-11-05 23:35:28 1903 2
原创 优化改进YOLOv5算法之添加MS-Block模块,有效提升目标检测效果(超详细)
本博客主要是参考YOLO-MS论文的创新点,在YOLOv5算法中引入MS-Block模块,利用不同尺度特征信息,以进一步提升目标检测效果。作者旨在为目标检测社区提供一种高效且性能卓越的目标检测器,称为YOLO-MS。核心设计基于一系列对不同Kernel-Size卷积如何影响不同尺度上目标检测性能的研究。研究结果是一种可以显著增强实时目标检测器多尺度特征表示的新策略。为了验证作者策略的有效性,作者构建了一个名为YOLO-MS的网络架构。
2023-11-02 22:37:45 1162 1
原创 优化改进YOLOv5算法:加入SPD-Conv模块,让小目标无处遁形——(超详细)
卷积神经网络(CNNs)在计算即使觉任务中如图像分类和目标检测等取得了显著的成功。然而,当图像分辨率较低或物体较小时,它们的性能会灾难性下降。这是由于现有CNN常见的设计体系结构中有缺陷,即使用卷积步长和/或池化层,这导致了细粒度信息的丢失和较低效的特征表示的学习。为此,我们提出了一个名为SPD-Conv的新的CNN构建块来代替每个卷积步长和每个池化层(因此完全消除了它们)。SPD-Conv由一个空间到深度(SPD)层和一个无卷积步长(Conv)层组成,可以应用于大多数CNN体系结构。
2023-10-30 23:12:49 1348
原创 优化改进YOLOv5算法:加入大核分离卷积注意力模块( Large Separable Kernel Attention),实现暴力涨点同时显著减少计算复杂性和内存——(超详细)
论文:Large Separable Kernel Attention: Rethinking theLarge Kernel Attention Design in CNN具有大内核注意力(LKA)模块的视觉注意力网络(VAN)已被证明在一系列基于视觉的任务中提供了卓越的性能,超过了视觉转换器(ViTs)。然而,随着卷积核大小的增加,这些LKA模块中的深度卷积层导致计算和内存占用的二次增加。为了缓解这些问题,并允许在VAN的注意模块中使用超大卷积核,我们提出了一个大的可分离核注意模块族,称为LSKA。LS
2023-10-29 23:34:06 1274 2
原创 优化改进YOLOv5算法:加入ODConv+ConvNeXt提升小目标检测能力——(超详细)
为了提升无人机视角下目标检测效果,基于YOLOv5算法,在YOLOv5主干中实现了Omnidimensional Convolution(ODConv),以在不增加网络宽度和深度的情况下提高精度,还在YOLOv5骨干网中用ConvNeXt块替换了原始的C3块,以加快检测速度。
2023-10-26 22:55:15 1338
原创 windows下安装Visual Studio + CMake+OpenCV + OpenCV contrib+TensorRT
最近在研究windows系统上部署安装目标检测算法,需要用到OpenCV软件,因为OpenCV可能是目前使用最广泛的开源图像处理工具了,尤其是在科研领域。于是,本篇博客主要详细记录一下如何在Windows 操作系统下,搭建Visual Studio 2022+OpenCV4.5.5+OpenCV contrib4.5.5的运行环境。安装Visual Studio比较简单,首先去Visual Studio官网下载安装包下载Community版本就可以了,其功能已经够用了。
2023-06-27 08:29:55 3133 1
原创 优化改进YOLOv5算法之针对小目标检测优化YOLOv5_Face2(超详细)
本文主要参考YOLO-FaceV2这个文章,该文章为了解决人脸检测中小目标、遮挡等问题,在YOLOv5算法的基础提出了几点改进,且取得了比较不错的效果。
2023-06-17 23:27:35 2741
原创 优化改进YOLOv5算法之添加Res2Net模块(超详细)
由于单独的Res2Net模块对于整体网络结构没有特定的要求,Res2Net模块的多尺度表示能力也和CNN的分层特征聚合模型彼此独立,所以可以很容易地将Res2Net模块集成到现有的其他优秀CNN模型中。模块内部的连接形式与残差网络(ResNet)类似,故命名为Res2Net。在本文中,研究人员在一个单个残差块内构造分层的残差类连接,为CNN提出了一种新的构建模块,即Res2Net——以更细粒度(granular level)表示多尺度特征,并增加每个网络层的感受野(receptive fields)范围。
2023-04-21 17:28:42 2862 2
原创 优化改进YOLOv5算法之改进用于微小目标检测的Normalized Gaussian Wasserstein Distance模块(超详细)
改进YOLOv5系列:全新改进用于微小目标检测的 Normalized Gaussian Wasserstein Distance
2023-03-16 09:40:54 2769 1
原创 优化改进YOLOv5算法之添加GIoU、DIoU、CIoU、EIoU、Wise-IoU模块(超详细)
IoU 的全称为交并比(Intersection over Union),通过这个名称我们大概可以猜到 IoU 的计算方法。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。计算过程如下:其中,绿色面积代表预测框B与真实框A的交集;则显而易见,IOU的值越高也说明预测框与真实框重合程度越高,代表模型预测越准确,反之,IOU越低模型性能越差。
2023-03-10 09:56:49 7357 2
原创 优化改进YOLOv5算法之Wise-IOU损失函数
边界框回归(BBR)的损失函数对于目标检测至关重要。它的良好定义将为模型带来显著的性能改进。大多数现有的工作假设训练数据中的样本是高质量的,并侧重于增强BBR损失的拟合能力。如果盲目地加强低质量样本的BBR,这将危及本地化性能。Focal EIoU v1被提出来解决这个问题,但由于其静态聚焦机制(FM),非单调FM的潜力没有被充分利用。基于这一思想,作者提出了一种基于IoU的损失,该损失具有动态非单调FM,名为Wise IoU(WIoU)。
2023-02-18 23:13:25 11243 1
原创 YOLOv8来啦 | 详细解读YOLOv8的改进模块!YOLOv5官方出品YOLOv8!
直接上YOLOv8的结构图吧,小伙伴们可以直接和YOLOv5进行对比,看看能找到或者猜到有什么不同的地方?YOLOv8网络结构图Backbone:使用的依旧是CSP的思想,不过YOLOv5中的C3模块被替换成了C2f模块,实现了进一步的轻量化,同时YOLOv8依旧使用了YOLOv5等架构中使用的SPPF模块;PAN-FPN。
2023-01-09 10:26:26 44813 14
原创 优化改进YOLOv5算法之添加SE、CBAM、CA模块(超详细)
本文主要是在YOLOv5算法中加入SE、CBAM和CA注意力机制模块,通过实验验证对比,加入CBAM和CA注意力机制后的效果均有所提升
2023-01-04 22:28:56 10990 24
原创 YOLOv5实战之输电线路绝缘子缺陷检测识别
本教程主要是利用YOLOv5算法实现对输电线路绝缘子缺陷进行检测识别。通过无人机搭载相机头云台对输电线路上的绝缘子进行数据采集,挑选出绝缘子上有故障的图片数据,共2000张左右图片,输电线路绝缘子缺陷数据集中的部分图片如下图所示。对收集到的2000张左右绝缘子缺陷数据集进行数据标注, 标注了3种常见的绝缘子缺陷类型:insulator、damaged、Flashover,利用LabelImg标注软件对数据进行标注,对标注后的数据进行统计,3种缺陷的标签分布情况如下图所示。
2022-10-29 10:20:27 10668 79
原创 卷积神经网络之深度可分离卷积(Depthwise Separable Convolution)
移动端设备的硬件性能限制了神经网络的规模。本文尝试解释一种被称为Depthwise Separable Convolution的卷积运算方式。它将传统卷积分解为Depthwise Convolution与Pointwise Convolution两部分,有效的减小了参数数量。卷积神经网络在图像处理中的地位已然毋庸置疑。卷积运算具备强大的特征提取能力、相比全连接又消耗更少的参数,应用在图像这样的二维结构数据中有着先天优势。
2022-10-15 13:45:56 1299
原创 万字长文详解目标检测算法,超大超全(2022最新)
基于深度神经网络的目标检测器不断发展,并用于多种应用,每个应用都有自己的一组要求。安全关键型的应用程序需要高精度和可靠性,而低延迟的任务需要节约资源的神经网络结构。实时目标检测器在有高影响力的现实世界应用中是必不可少的,并不断有新方法提出,但它们过分强调精度和速度上的改进,而忽略了其他方面,如多功能性、鲁棒性、资源和能源效率。现有网络的参考基准不存在,新网络设计的标准评估指南也不存在,这导致比较模棱两可和不一致。
2022-09-16 16:39:48 16800 1
原创 目标检测算法YOLOv1原理与实现
当我们谈起计算机视觉时,首先想到的就是图像分类,没错,图像分类是计算机视觉最基本的任务之一,但是在图像分类的基础上,还有更复杂和有意思的任务,如目标检测,物体定位,图像分割等,见图1所示。其中目标检测是一件比较实际的且具有挑战性的计算机视觉任务,其可以看成图像分类与定位的结合,给定一张图片,目标检测系统要能够识别出图片的目标并给出其位置,由于图片中目标数是不定的,不仅要检测出目标的位置且要给出目标所属类别,因此目标检测相比分类任务更复杂。
2022-09-01 23:09:05 1335
原创 Meta Faster R-CNN:基于注意力特征对齐的小样本目标检测
论文标题:Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with Attentive Feature Alignment论文链接:https://arxiv.org/abs/2104.077191 出发点 & 创新点1.1 出发点以往的方法使用基于base类数据训练得到的 RPN 去生成 novel 类的候选框,这样做会错过一些新类的高 IoU 框,因为在 RPN 训练中,novel 类框被视为 ba
2022-03-29 10:38:35 7750
原创 神经网络轻量化改进之CNN架构设计
卷积神经网络架构设计,又指backbone设计,主要是根据具体任务的数据集特点以及相关的评价指标来确定一个网络结构的输入图像分辨率,深度,每一层宽度,拓扑结构等细节。公开发表的论文大多都是基于ImageNet这种大型的公开数据集来进行的通用结构设计,早期只以其分类精度来证明设计的优劣,后来也慢慢开始对比参数量(Params)和计算量(FLOPs),由于ImageNet的数据量十分巨大且丰富,所以通常在该数据集上获得很好精度的网络结构泛化到其他任务性能也都不会差。但在很多特定任务中,这种通用的结构虽然效果还可
2022-03-25 17:21:59 2946 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人