1 前言
YOLOv5 一共有 yolov5l, yolov5m, yolov5n, yolov5s, yolov5x 五个版本, 本文主要介绍YOLOv5s模型的网络结构。
2 源文件介绍
YOLOv5所用到的所有模块基本上都保存在 common.py这个文件中,在yolo.py文件中会根据yaml文件调用所需要的模块构建网络模型。
3 YOLOv5s 网络结构
3.1 yaml 文件解读
以第一个卷积模块为例[-1, 1, Conv, [64, 6, 2, 2]],-1 表示模型的输入来自上一层的输入,1代表着这里只包含一个卷积模块,Conv就是卷积层, [64,6,2,2] 就是传入模块的参数,在这里64是输出通道数,6是kernel size,2是stride,最后一个2是padding。关于参数后会在结构图中有详细展示。
anchors:中包含的是锚点的信息,yolov5在最后生成预测时用到了三个特征层的信息,每一行对应一个特征层,每行中的元素代表着三个不同尺寸锚框的信息。
需要特别注意的是 depth_multiple 和 width_multiple 这两个量,yolov5在进行模型创建的过程中并不会直接使用yaml文件中的所有参数,每个模块的depth_number乘以depth_multiple,输出通道数乘以width_multiple才是模型最终使用的参数。
# Parameters
nc: 80 # number of classes
depth_multiple: 0.33 # model depth multiple
width_multiple: 0.50 # layer channel multiple
anchors: #锚点的信息
- [10,13, 16,30, 33,23] # P3/8
- [30,61, 62,45, 59,119] # P4/16
- [116,90, 156,198, 373,326] # P5/32
# YOLOv5 v6.0 backbone
backbone:
# [from, depth_number, module, args]
# from:模块输入来自哪里
# depth_number:模块包含几层(主要对应C3模块中存在几个BottleNeck)
# module:模块对应的名称
# args:传入模块的参数
[[-1, 1, Conv, [64, 6, 2, 2]], # 0-P1/2
[-1, 1, Conv, [128, 3, 2]], # 1-P2/4
[-1, 3, C3, [128]],
[-1, 1, Conv, [256, 3, 2]], # 3-P3/8
[-1, 6, C3, [256]],
[-1, 1, Conv, [512, 3, 2]], # 5-P4/16
[-1, 9, C3, [512]],
[-1, 1, Conv, [1024, 3, 2]], # 7-P5/32
[-1, 3, C3, [1024]],
[-1, 1, SPPF, [1024, 5]], # 9
]
# YOLOv5 v6.0 head
head:
[[-1, 1, Con