Yolo5完整解析图
Yolo5核心的一些东西:
- 输入端:
- mosaic、仿射变换等。
- 自适应锚框计算。
- 自适应图片缩放。(能提升37%推理速度)
- Backbone:Focus结构(提升推理速度)、新的CSP结构。
- Neck:SPP、FPN+PAN的结构,
- 输出端:
- 3个临近grid cell负责预测目标,相当于增加了2倍正样本量,极大加速收敛,并修改了预测框回归公式(具体见解析图)
- 刚开始是边框回归用GIOU-Loss,后面版本又改成CIOU-Loss。
其他细节改动:
- 抛弃了基于max iou匹配的规则,而是直接采用shape(也就是该bbox和当前层的anchor计算宽高比)。
- 还有太多细节,而且这些细节不停改动变化中,不细说了。