目标检测学习之路——YOLOv2

最新推荐文章于 2022-11-12 21:06:57 发布

澎湃de家夥

最新推荐文章于 2022-11-12 21:06:57 发布

阅读量786

点赞数

分类专栏：目标检测深度学习 YOLOv2 文章标签： YOLOv2 目标检测

本文链接：https://blog.csdn.net/MiaoB226/article/details/103636021

版权

YOLOv2在YOLOv1基础上进行网络结构改进，包括引入BN层、使用高分辨率分类器、Anchor Boxes以及直接位置预测等，提升了目标检测准确率。此外，提出联合训练策略，实现9000类物体检测。文章深入解析了YOLOv2的各个改进点，包括BN层、Anchor Boxes的引入、直接位置预测和多尺度训练等。

摘要由CSDN通过智能技术生成

YOLOv2

YOLOv2相对于V1的改进主要有两方面：1、使用一系列策略对YOLOv1的网络结构进行了修改，在保证检测速度的同时提升了模型的检测准确率；2、提出了一种联合训练策略，使用ImageNet与COCO联合训练得到YOLO9000模型，可以实现9000类物体的目标检测。本文将从这两个改进策略对YOLOv2模型进行介绍。

个人觉得改进2（联合训练方法）的意义更大，这种训练方法可以迁移到其它检测模型，使检测模型可以检测到更多更详细的目标种类信息。

论文地址：https://arxiv.org/pdf/1612.08242.pdf。

网络结构层面的改进

1、BN层的引入（BatchNormalization）

YOLOv2网络模型通过在每一个卷积层后添加BN层，极大的改善了网络模型训练时到的收敛速度同时减少了模型对其它正则化方法的依赖（舍弃了dropout优化后依然没有过拟合），使得mAP获得了2%的提升。

2、适用高分辨率图像的分类器（High Resolution Classiﬁer）

YOLOv1模型时使用ImageNet数据集以224×224的分辨率来预训练了分类模型，之后在分类模型的基础上改进为检测模型，基于分类模型已有的权重来初始化检测模型的权重，最终使用448×448分辨率的图像来训练检测模型。因此，在模型迁移后进行检测模型训练时，模型不仅需要来学习检测任务，而且需要有一个适应高分辨率图像输入的学习过程。YOLOv2解决了这个问题，YOLOv2使用ImageNet数据集预训练分类模型时，直接使用448×448分辨率的图像作为模型的输入（在ImageNet上共计训练了10个epoch），从而避免了模型迁移时分辨率变化的这一现象。

3、引入了Anchor Boxes用于目标检测（Convolutional With Anchor Boxes）

YOLOV1模型的最后使用了全连接层，这也就导致YOLOV1只能接受固定大小图像的输入。其次，在YOLOv1中，输入图像最终被划分为7×7的网格，每个单元格预测2个bounding box，并且最终取置信度最大的那个bounding box作为单元格的预测结果。这也就意味着YOLOV1模型最多只能预测出49个bounding box，也因此YOLOV1对小目标的检测不太友好。因此YOLOv2借鉴了faster rcnn所采用的的RPN策略（即采用anchor box来预测检测结果）。

因此YOLOv2移除了全连接层，这样可以保证模型可以接受不同分辨率图像的输入（这里输入图像的分辨率也是有限制的，因为YOLOV2模型总体的下采样系数为32，因此输入图像的分辨率必须是32的倍数）。作者实验证明，图像中大目标更倾向于出现在图像的中心，作者期望模型输出的特征图中有一个中心点来专门预测这些大目标，因此网络输出的特征图尺寸应该为奇数（奇数尺寸才能拥有一个绝对的中心点）。论文中检测模型输入图像的分辨率为416×416，网络最后一层输出的特征图尺寸为13×13。

YOLOv2为每个anchor box预测所属的类别以及bounding box中含有目标的分数，因此YOLOv2可以预测出13×13×5=845个bounding box。

4、采用聚类的方法生成Anchor Boxes（Dimension Clusters）

在Faster R-CNN和SSD中，Anchor Box（长和宽）都是人为手动设定的。如果选取的Anchor Box比较适用于当前数据集，则模型更容易学习和收敛，从而得到更好的预测结果。因此，YOLOv2采用k-means聚类方法对训练集中的bounding box进行了聚类分析，从而获取更适合当前数据集的Anchor Box。因为Anchor Box的选定是为了使模型预测的bounding box更接近ground truth ，因此在进行k-means聚类时距离指标采用聚类中心（bounding box）与ground truth的IOU值：