Yolov5改进
文章平均质量分 91
yolo系列顶刊顶会复现
kay_545
在职算法工程师,面试官
一篇SCI一区第一作者,两篇SCI二区第一作者,指导多位师弟师妹完成高水平论文创作
展开
-
YOLOv5 | 鬼魅(幽灵)卷积 | 改进Ghost卷积轻量化网络
卷积层和建议的 Ghost 模块的图示,用于输出相同数量的特征图。Φ 代表廉价操作深度卷积神经网络通常由大量卷积组成,这会导致巨大的计算成本。尽管 MobileNet 和 ShuffleNet 等最近的工作引入了深度卷积或洗牌操作,以使用较小的卷积滤波器(浮点数操作)构建高效的 CNN,但剩余的 1 × 1 卷积层仍然会占用大量内存和失败。其中*是卷积运算,b是偏置项,Y ∈ Rh′×w′×n是n个通道的输出特征图,f ∈ Rc×k×k×n是该层的卷积滤波器。原创 2024-03-28 13:17:14 · 1483 阅读 · 0 评论 -
YOLOv5 | 注意力机制 | 添加ECA注意力机制
ECA 模块图给定通过全局平均池化 (GAP) 获得的聚合特征,ECA 通过执行大小为 k 的快速一维卷积来生成通道权重,其中 k 通过通道维度 C 的映射自适应确定。首先回顾 SENet 中的通道注意模块(即 SE 块)。然后,我们通过分析降维和跨渠道交互的影响,对 SE 区块进行实证诊断。这促使我们提出 ECA 模块。此外,一种自适应确定 ECA 参数的方法,并最终展示如何将其应用于深度 CNN。在重新审视SE块之后,进行了实证比较,分析通道降维和跨通道交互对通道注意力学习的影响。原创 2024-03-26 13:11:24 · 1355 阅读 · 0 评论 -
YOLOv5中detect.py各个的参数含义
这些参数用于配置和控制YOLOv5模型的推断(detect)过程,即检测物体。- 是否使用OpenCV DNN进行ONNX推断。- NMS(非极大值抑制)的IoU(交并比)阈值。- 推断时使用的设备,可以是CUDA设备或CPU。- 是否在保存的文本文件中包含置信度信息。- 模型权重文件路径,可以是多个路径。- 推断时的图像尺寸,可以是多个尺寸。- 是否使用类别不可知的NMS。- 是否使用FP16半精度推断。- 是否保存裁剪的预测框。- 是否显示检测结果图像。- 是否保存图像或视频。- 是否进行增强的推断。原创 2023-10-06 11:52:45 · 429 阅读 · 1 评论 -
YOLOv5中train.py各个的参数含义
缓存图像以加快训练速度,可以选择在内存('ram')或磁盘('disk')中缓存。- 是否从最近的训练中恢复。这些参数用于配置YOLOv5模型的训练过程,可以根据需要进行调整。- 初始权重路径,默认为预训练的YOLOv5模型权重路径。- 是否使用多尺度训练,图像尺寸在原始尺寸的基础上变化。- EarlyStopping的耐心度(不改善的轮数)。- 训练使用的设备,可以是CUDA设备或CPU。- 模型配置文件(model.yaml)的路径。- 训练和验证时的图像尺寸(像素)。原创 2023-10-06 11:45:12 · 120 阅读 · 1 评论 -
YOLOv5 | 涨点复现!YOLOv5添加BiFPN有效提升目标检测精度
模型效率在计算机视觉中变得越来越重要。在本文中,我们系统地研究了用于目标检测的神经网络架构设计选择,并提出了几个提高效率的关键优化。首先,我们提出了一种加权双向特征金字塔网络(BiFPN),它可以轻松快速地进行多尺度特征融合;其次,我们提出了一种复合缩放方法,可以同时统一缩放所有主干网络、特征网络和框/类预测网络的分辨率、深度和宽度。基于这些优化和 EfficientNet 主干,我们开发了一个新的目标检测器系列,称为 EfficientDet,它在各种资源限制下始终实现比现有技术更高的效率。原创 2024-03-14 20:45:53 · 1467 阅读 · 0 评论 -
YOLOV5添加 ECA CA SE CBAM 等八种注意力机制(小白可用)
⭐欢迎大家订阅我的专栏一起学习⭐。原创 2024-03-13 14:33:26 · 4238 阅读 · 0 评论 -
YOLO 手动计算anchor的值
因此,锚点在 YOLO 中扮演着关键的角色,它们帮助模型理解图像中的目标,并实现准确的目标检测。在每个网格单元中,YOLO 使用锚点来生成多个候选边界框,并根据这些候选边界框的得分和类别信息来确定最终的检测结果。在训练过程中,YOLO 使用这些预定义的锚点来调整和优化模型,使其能够更准确地预测目标的位置和大小。锚点的计算通常包括选择合适的尺寸和比例,以及在训练过程中优化它们以适应特定的数据集和目标。因此,锚点在 YOLO 中起着至关重要的作用,它们帮助模型理解和预测图像中的目标,并实现准确的目标检测。原创 2024-02-27 10:14:13 · 433 阅读 · 0 评论 -
YOLOv5改进——模型级联
相反,YOLO 是一种单阶段的目标检测器,它通过一个神经网络直接从图像中预测目标的位置和类别。YOLO 的设计理念是简单高效,它通过单次前向传播即可完成目标检测,因此不需要像级联式目标检测器那样的多个阶段。因此,在设计级联式单阶段检测器时需要进行仔细的实验和调整,以找到最佳的权衡点。在计算机视觉中,级联(Cascade)指的是一种多级的处理流程,其中每个级别都进行一些特定的操作,并且输出被传递到下一个级别。在传统的级联目标检测器中,通常会将多个分类器串联在一起,每个分类器负责检测特定的目标或目标的一部分。原创 2024-01-29 17:40:29 · 523 阅读 · 1 评论 -
解决Yolov5的RuntimeError: result type Float can‘t be cast to the desired output type long int 问题
Yolov5运行时出现RuntimeError: result type Float can't be cast to the desired output type long int 问题原创 2023-01-05 22:00:38 · 2094 阅读 · 8 评论