上回说到数据和标签的准备和处理,这回我们说一下Darknet网络的架构以及计算过程🧐
注:关于配置文件中各参数的含义,参考详解 yolo配置文件各参数的含义_零碎@流年絮语 的博客-CSDN博客
1.模型构建
在model.py中定义Darknet类,构造函数中读取模型配置文件,并调用create_modules()函数,根据配置文件,对每一层进行构建
接下来我们简要分析 create_modules()函数中构建每一层的操作
首先读取网络的基本参数后,从配置中按顺序读取每一层的参数,并根据参数构建相应的层
注:其实每一层不是单纯的卷积,而是和BN和Relu组合的组合层
调用YOLOLayer()构建yolo层
2.前向传播过程
在Darknet类的forward()函数中,按照每一层定义的顺序进行前向传播计算
每个隐藏层输出结果存储在layer_outputs[]中,最终yolo的输出结果在yolo_outputs[]中(注意有三个yolo层,分别代表三个预测框的结果)
卷积、池化、上采样、特征融合、残差连接的操作在图中已注释,重点是yolo层的前向传播
在执行Darknet中的forward()后,会进入YOLOLayer中的forward(),执行yolo层的前向传播
①得到预测概率
②将特征图网格还原到原始图像
③处理标签并筛选IOU最好的预测框(详细计算在utils.py,实现过于复杂,感兴趣可以看看)
④计算损失
将各种损失函数计算并累加
前向传播过程结束后,根据评估损失进行反向传播,由pytorch框架实现