yolo v2:yolo 9000,检测目标种类超过9000
1.Batch Normalization
在每个卷积层后都添加了BN层,不再使用dropout
2.高分辨率分类器
从224*224——>448*448,更大的输入尺寸
3.使用anchor box
4.anchor聚类,K-means算法
5.目标边界框预测的改进,每个anchor只负责预测网格区域内的目标
6.更底层的信息,低层特征与高层特征融合
7.多尺度训练方法:416*416 480*480 每迭代10轮,就随机选择一个尺寸
BackBone:DarkNet-19 (19个卷积层)
YOLOv3:An Incremental Improvement(一种递增的提高)
yolo v3模型
在三个预测特征层上进行预测的
每个预测特征层会使用三种尺度
这个1是confidence score
在预测特征层1上预测大目标 在3上预测小目标
yolov3 目标边界框的预测
正样本选取:只选与bounding box重合度最大的
不是最大的,但是超过阈值的,就丢弃
yolov3 spp
Mosaic图像增强
之前的图像增强方法:随机裁剪 随机水平翻转 色度饱和度
在yolo v3第一个预测特征层之前插入了spp结构