一、YOLO模型的发展:
YOLO各版本对应的输入输出:
版本 | 输入 | 输出 |
---|---|---|
YOLO V1 | 448 X 448 X3 | 7 X 7 X 30 |
YOLO V2 | 416 X 416 X 3 | 13 X 13 X 5 X 25 |
YOLO V3 | 416 X 416 X 3 | 13 X 13 X 255、26 X 26 X 255、52 X 52 X 255 |
注:在YOLO V2输出中,1313表示网格数,5表述先验框个数,25表示类别数20(VOC 20类对象)+ 边框坐标4 + 边框置信度1。在YOLO V3中,1313表示感受野,255表示3*(80+5)
二、YOLO V3
backbone:提取特征
neck:FPN特征金字塔
head:输出层
输出的的图片越大,单张图片预测框数量越少。
损失函数:IOU<0.5为负样本
训练过程:
测试过程: