YOLO的缺点:1.定位不准确 2.召回率低 YOLOv2对此进行了修改
1.Batch Normalization
对网络的每一层的输入都做归一化,收敛会快一点,原来的YOLO算法没有BN层,YOLOv2在每个卷积层都添加了BN层,并且将dropout去掉,可以提升2%的mAP
2.High Resolution Classifier
一般都是用预训练的网络来finetuning自己的网络,而且预训练的网络一般都是在ImageNet数据集上跑。原来的YOLO网络预训练的输入是224224,detection时采用448448,这样会导致在切换到检测模形时,还需要适应图像分辨率的改变,YOLOv2采用的是224224的输入先训练160个epoch,然后将输入调整到448448训练10个epoch,这两步都是在ImageNet上进行的。detection时用448448的输入,实验表明可以提高4%的mAP
3.Convolutional with Anchor Boxes
YOLO时利用全连接层直接预测bounding box的坐标,YOLOv2借鉴了Faster R-cnn的思想引入了anchors。首先将原网络的全连接层和最后一个池化层去除,这样可以使得特征图得到更高的分辨率,然后缩减网络,用416416代替原来的448448,这样可以保证只有一个center cell。因为一般的大目标都会集中在图像的中心,这样只需要一个cell来预测该目标,否则需要4个。网格最终将416416的输入变成1313大小的feeature map的输出,缩小比例为32.原来的YOLO算法将输入图像分成77的网格,,每个网格预测2个边界框,因此一共是98个边界框,
YOLOv2
最新推荐文章于 2022-08-07 10:11:02 发布