目录
1 各模块的作用
1.1 Focus:减少运算量
1.2 CSPNet跨阶段局部网络
1.3 SPP空间金字塔池化
最大池化一般会导致特征图的减小,需要填充使特征图大小一样,最后拼接。可以增加感受野。
1.4 PANet
不同尺度进行融合时,最大和最小比较难融合,所以有个上采样和下采样,比较好融合。
2 损失函数
分类损失
定位损失
置信度损失
总的损失函数:classification loss+ localization loss + confidence loss
YOLOv5使用二元交叉熵损失函数计算类别概率和目标置信度得分的损失
YOLOv5使用CIOU loss作为bounding box回归的损失
2.1 类别预测
2.2 定位损失
2.2.1 GIOU LOSS
2.2.2 DIOU LOSS
考虑到框中心点的距离
损失函数可以表达为1-IOU+惩罚项
DIOUloss定义如下
2.2.3 CIOU LOSS
CIOU加入了一项宽高比的吻合度v
CIOU考虑的集合更多,yolov5默认采用CIOU
2.2.4 目标框回归
回归策略
VOC标注格式
yolo格式是基于中心点和目标框的宽高,并且归一化
Anchor给出了目标宽高的初始值,需要回归的是目标真实宽高与初始宽高的偏移量,偏移值是0时候,得到的就是预先设定的框。
跨网格的匹配策略
可以得到更多的正样本anchor加速收敛