YOLOv5 模型学习笔记，超详细模型结构

一品炼药师

已于 2023-08-20 06:28:05 修改

阅读量2.2k

点赞数 4

文章标签： YOLO 学习笔记 python

于 2023-08-20 06:12:06 首次发布

本文链接：https://blog.csdn.net/weixin_42864272/article/details/132388277

版权

1 前言

YOLOv5 一共有 yolov5l, yolov5m, yolov5n, yolov5s, yolov5x 五个版本，本文主要介绍YOLOv5s模型的网络结构。

2 源文件介绍

YOLOv5所用到的所有模块基本上都保存在 common.py这个文件中，在yolo.py文件中会根据yaml文件调用所需要的模块构建网络模型。

3 YOLOv5s 网络结构

3.1 yaml 文件解读

以第一个卷积模块为例[-1, 1, Conv, [64, 6, 2, 2]]，-1 表示模型的输入来自上一层的输入，1代表着这里只包含一个卷积模块，Conv就是卷积层， [64，6，2，2] 就是传入模块的参数，在这里64是输出通道数，6是kernel size，2是stride，最后一个2是padding。关于参数后会在结构图中有详细展示。

anchors：中包含的是锚点的信息，yolov5在最后生成预测时用到了三个特征层的信息，每一行对应一个特征层，每行中的元素代表着三个不同尺寸锚框的信息。

需要特别注意的是 depth_multiple 和 width_multiple 这两个量，yolov5在进行模型创建的过程中并不会直接使用yaml文件中的所有参数，每个模块的depth_number乘以depth_multiple，输出通道数乘以width_multiple才是模型最终使用的参数。

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.50  # layer channel multiple
anchors: #锚点的信息
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 v6.0 backbone
backbone:
  # [from, depth_number, module, args] 
  # from：模块输入来自哪里
  # depth_number：模块包含几层（主要对应C3模块中存在几个BottleNeck）
  # module：模块对应的名称
  # args：传入模块的参数
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

# YOLOv5 v6.0 head
head:
  [[-1, 1, Con