YOLOV5改进篇
文章平均质量分 82
作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果
梦在黎明破晓时啊
这个作者很懒,什么都没留下…
展开
-
YOLOv5提升模型训练结果小技巧
YOLOv5是一种流行的深度学习算法,用于实时目标检测任务。由于其高效性和速度,YOLOv5被广泛应用于各种实际应用中。然而,有时候模型的训练结果可能不尽如人意。在这篇文章中,我们将介绍一些提升YOLOv5模型训练结果的小技巧。原创 2023-12-26 23:23:48 · 2771 阅读 · 0 评论 -
YOLO算法改进7【中阶改进篇】:主干网络C3替换为轻量化网络MobileNetV3
解决问题:YOLOv5主干特征提取网络采用C3结构,带来较大的参数量,检测速度较慢,应用受限,在某些真实的应用场景如移动或者嵌入式设备,如此大而复杂的模型时难以被应用的。前 言:作为当前先进的深度学习目标检测算法YOLOv5,已经集合了大量的trick,但是还是有提高和改进的空间,针对具体应用场景下的检测难点,可以不同的改进方法。此后的系列文章,将重点对YOLOv5的如何改进进行详细的介绍,目的是为了给那些搞科研的同学需要创新点或者搞工程项目的朋友需要达到更好的效果提供自己的微薄帮助和参考。原创 2023-12-24 23:29:33 · 1454 阅读 · 0 评论 -
解读SPP / SPPF / SimSPPF / ASPP / RFB / SPPCSPC
RFB模块是在《ECCV2018:Receptive Field Block Net for Accurate and Fast Object Detection》一文中提出的,该文的出发点是模拟人类视觉的感受野从而加强网络的特征提取能力,在结构上RFB借鉴了Inception的思想,主要是在Inception的基础上加入了空洞卷积,从而有效增大了感受野。ASPP是在DeepLab中提出来的,在后续的DeepLab版本中对其做了改进,如加入BN层、加入深度可分离卷积等,但基本的思路还是没变。原创 2023-12-24 21:41:29 · 2365 阅读 · 3 评论 -
YOLO算法改进6【中阶改进篇】:depthwise separable convolution轻量化C3
而且这种运算对输入层的每个通道独立进行卷积运算,没有有效的利用不同通道在相同空间位置上的feature信息。Pointwise Convolution的运算与常规卷积运算非常相似,它的卷积核的尺寸为 1×1×M,M为上一层的通道数。对于一张5×5像素、三通道(shape为5×5×3),经过3×3卷积核的卷积层(假设输出通道数为4,则卷积核shape为3×3×3×4,最终输出4个Feature Map,如果有same padding则尺寸与输入层相同(5×5),如果没有则为尺寸变为3×3。原创 2023-11-04 15:09:10 · 360 阅读 · 0 评论 -
YOLO算法改进5【中阶改进篇】:添加SENet注意力机制
SE-Net 是 ImageNet 2017(ImageNet 收官赛)的冠军模型,是由WMW团队发布。具有复杂度低,参数少和计算量小的优点。且SENet 思路很简单,很容易扩展到已有网络结构如 Inception 和 ResNet 中。我们可以看到,已经有很多工作在空间维度上来提升网络的性能。那么很自然想到,网络是否可以从其他层面来考虑去提升性能,比如考虑特征通道之间的关系?作者基于这一点并提出了(简称SE-Net)。原创 2023-11-03 15:47:07 · 698 阅读 · 0 评论 -
YOLO算法改进4【中阶改进篇】:添加DeformableConvolution v2可变形卷积模块
他站上演讲台,说他是个性boy,他会变形,不像常规卷积那样死板,他更灵活,可以应对上述提到的物体复杂形变的场景。传统的卷积操作是将特征图分成一个个与卷积核大小相同的部分,然后进行卷积操作,每部分在特征图上的位置都是固定的。这样,对于形变比较复杂的物体,使用这种卷积的效果就可能不太好了。对于这种情况,传统做法有丰富数据集,引入更多复杂形变的样本、使用各种数据增强和trick,以及人工设计一些手工特征和算法。论文地址: https://arxiv.org/abs/1811.11168。声明的位置如下图所示。原创 2023-10-31 22:37:00 · 322 阅读 · 0 评论 -
YOLO算法改进3【中阶改进篇】:添加HorNet卷积模块
HorNet是在Swin transformer结构的基础上,结合大核思想提出的新的网络结构模块,使用该模块,作者在ImageNet-1k数据集上做分类,分割以及检测任务都在当时达到了SOTA的效果,是一个能有效增强各种网络的性能而不会引入太大参数量的一种改进思路,已经有很多博主提出将该模块用于yolo系列网络中,以期望达到更好的效果。源码地址: https://github.com/raoyongming/HorNet.论文地址:https://arxiv.org/pdf/2207.14284.pdf。原创 2023-10-31 21:47:37 · 447 阅读 · 0 评论 -
YOLO算法改进2【中阶改进篇】:添加CBAM注意力机制
CBAM旨在自动学习输入特征图的空间和通道注意力权重,从而更好地捕捉图像中的局部信息和全局上下文。(Spatial Attention Module) : 空间注意力模块的目的是为输入特征图的每个位置分配一个注意力权重。(ChannelAttention Module) : 通道注意力模块旨在为输入特征图的每个通道分配一个权重,从而强调重要的通道并抑制不太重要的通道。包括两个主要组成部分: 空间注意力模块和通道注意力模块。最后,将空间注意力模块和通道注意力模块的输出相加,形成CBAM调整后的特征图。原创 2023-07-10 21:15:12 · 690 阅读 · 0 评论 -
YOLO算法改进1【中阶改进篇】: 添加SA-Net注意力机制
可以看出首先将输入的特征分为g组,然后每一组的特征进行split,分成两个分支,分别计算 channel attention 和 spatialattention,两种 attention 都使用全连接 + sigmoid 的方法计算。找到 models/yolo.py 文件中 parse_model() 图数的 for ,(f,n,m, args) in(258行上下) 并其循环内添加如下代码enumerate(dl"backbone"] + dl head"])添加至/models/文件中。原创 2023-07-10 22:17:48 · 170 阅读 · 0 评论