yolov8模型结构

Fool832

已于 2024-07-14 16:25:04 修改

阅读量827

点赞数 15

文章标签： YOLO

于 2024-02-27 16:35:59 首次发布

本文链接：https://blog.csdn.net/fool996/article/details/136324126

版权

本文详细解析了Yolov8的backbone结构，包括卷积层、池化操作、空间金字塔池化(SPPF)以及head连接部分。介绍了如何通过参数调整控制模型深度和宽度，以及特征图的计算方法。

摘要由CSDN通过智能技术生成

backbone结构：

from：

-n，代表是从前n层获得的输入

-1，表示从前一层获得输入

repeats：

表示模块的数目

Module：

表示网络模块的名称

args：

表示向不同模块内传递的参数

[输出通道数（ch_out），卷积核（kernel），步长（stride），padding（填充），groups（分组）]

这里没有输入通道数，原因是都是上一层的输出

具体的程序注释如下：

backbone:
  # [from, repeats, module, args]
  - [-1, 1, Conv, [64, 3, 2]]  # 0-P1/2         第0层，使用64个3x3的卷积核，步长为2进行卷积，得到P1/2特征图
  - [-1, 1, Conv, [128, 3, 2]]  # 1-P2/4        第1层，使用128个3x3的卷积核，步长为2进行卷积，得到P2/4特征图
  - [-1, 3, C2f, [128, True]]                  #第2层，进行3次池化操作，每次操作使用128个通道，最后一次操作使用降维（True）
  - [-1, 1, Conv, [256, 3, 2]]  # 3-P3/8        第3层，使用256个3x3的卷积核，步长为2进行卷积，得到P3/8特征图
  - [-1, 6, C2f, [256, True]]                  #第4层，进行6次池化操作，每次操作使用256个通道，最后一次操作使用降维（True）
  - [-1, 1, Conv, [512, 3, 2]]  # 5-P4/16       第5层，使用512个3x3的卷积核，步长为2进行卷积，得到P4/16特征图
  - [-1, 6, C2f, [512, True]]                  #第6层，进行6次池化操作，每次操作使用512个通道，最后一次操作使用降维（True）
  - [-1, 1, Conv, [1024, 3, 2]]  # 7-P5/32      第7层，使用1024个3x3的卷积核，步长为2进行卷积，得到P5/32特征图
  - [-1, 3, C2f, [1024, True]]                 #第8层，进行3次池化操作，每次操作使用1024个通道，最后一次操作使用降维（True）
  - [-1, 1, SPPF, [1024, 5]]  # 9               第9层，使用1024个通道的SPPF（空间金字塔池化）层，使用5个不同大小的池化核进行池化操作

然后，P1/2表示进行操作后的图形大小