YOLOv5白皮书-第Y3周：yolov5s.yaml文件解读

最新推荐文章于 2024-06-20 02:51:45 发布

LoveData_

最新推荐文章于 2024-06-20 02:51:45 发布

阅读量187

点赞数

文章标签： python 深度学习人工智能

本文链接：https://blog.csdn.net/m0_57273156/article/details/128584736

版权

yolov5s.yaml文件解读

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊|接辅导、项目定制

本周任务：将yolov5s网络模型中第4层的C3*2修改为C3*1，第6层的C3*3修改为C3*2。

# Parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple   控制模型的深度
width_multiple: 0.50  # layer channel multiple 控制Conv通道channel个数(卷积核数量)

子模块数量 = int ( number * depth_multiple )
卷积核的数量 = int ( number * width_multiple)

anchors:
  - [10,13, 16,30, 33,23]  # P3/8       检测小目标，10,13是一组尺寸，总共三组检测小目标
  - [30,61, 62,45, 59,119]  # P4/16     检测中目标，共三组
  - [116,90, 156,198, 373,326]  # P5/32 检测大目标，共三组

YOLOv5 初始化了9个 anchors，在三个Detect层使用（3个 feature map）中使用，每个feature map的每个 grid_cell 都有三个anchor进行预测。分配的规则是：尺度越大的 feature map 越靠前，相对原图的下采样率越小，感受野越小，所以相对可以预测一些尺度比较小的物体，所有分配到的 anchors 越小；尺度越小的 feature map 越靠后，相对原图的下采样率越大，感受野越大，所以相对可以预测一些尺度比较大的物体，所有分配到的 anchors 越大。即可以在小特征图（feature map）上检测大目标，也可以在大特征图上检测小目标。

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  """
  from: 表示当前模块的输入来自那一层的输出 -1表示来自上一层的输出
  number: 表示当前模块的理论重复次数 实际的重复次数还要由上面的参数depth_multiple共同决定 决定网络模型的深度
  moduld: 模块类名 通过这个类名去common.py中寻找相应的类 进行模块化的搭建网络
  args: 是一个list 模块搭建所需参数 channel, kernel_size, stride, padding, bias等 会在网络搭建过程中根据不同层进行改变
  """
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

修改：

# YOLOv5 v6.0 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 3, C3, [256]], # 第四层 number * 1/3 = 1
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 6, C3, [512]], # 第六层 number * 1/3 = 2
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

head

# YOLOv5 v6.0 head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]