目标检测学习之路——YOLOv2

                                            YOLOv2

YOLOv2相对于V1的改进主要有两方面:1、使用一系列策略对YOLOv1的网络结构进行了修改,在保证检测速度的同时提升了模型的检测准确率;2、提出了一种联合训练策略,使用ImageNet与COCO联合训练得到YOLO9000模型,可以实现9000类物体的目标检测。本文将从这两个改进策略对YOLOv2模型进行介绍。

个人觉得改进2(联合训练方法)的意义更大,这种训练方法可以迁移到其它检测模型,使检测模型可以检测到更多更详细的目标种类信息。

论文地址:https://arxiv.org/pdf/1612.08242.pdf

网络结构层面的改进

1、BN层的引入(BatchNormalization)

YOLOv2网络模型通过在每一个卷积层后添加BN层,极大的改善了网络模型训练时到的收敛速度同时减少了模型对其它正则化方法的依赖(舍弃了dropout优化后依然没有过拟合),使得mAP获得了2%的提升。

2、适用高分辨率图像的分类器(High Resolution Classifier)

YOLOv1模型时使用ImageNet数据集以224×224的分辨率来预训练了分类模型,之后在分类模型的基础上改进为检测模型,基于分类模型已有的权重来初始化检测模型的权重,最终使用448×448分辨率的图像来训练检测模型。因此,在模型迁移后进行检测模型训练时,模型不仅需要来学习检测任务,而且需要有一个适应高分辨率图像输入的学习过程。YOLOv2解决了这个问题,YOLOv2使用ImageNet数据集预训练分类模型时,直接使用448×448分辨率的图像作为模型的输入(在ImageNet上共计训练了10个epoch),从而避免了模型迁移时分辨率变化的这一现象。

3、引入了Anchor Boxes用于目标检测(Convolutional With Anchor Boxes)

YOLOV1模型的最后使用了全连接层,这也就导致YOLOV1只能接受固定大小图像的输入。其次,在YOLOv1中,输入图像最终被划分为7×7的网格,每个单元格预测2个bounding box,并且最终取置信度最大的那个bounding box作为单元格的预测结果。这也就意味着YOLOV1模型最多只能预测出49个bounding box,也因此YOLOV1对小目标的检测不太友好。因此YOLOv2借鉴了faster rcnn所采用的的RPN策略(即采用anchor box来预测检测结果)。

因此YOLOv2移除了全连接层,这样可以保证模型可以接受不同分辨率图像的输入(这里输入图像的分辨率也是有限制的,因为YOLOV2模型总体的下采样系数为32,因此输入图像的分辨率必须是32的倍数)。作者实验证明,图像中大目标更倾向于出现在图像的中心,作者期望模型输出的特征图中有一个中心点来专门预测这些大目标,因此网络输出的特征图尺寸应该为奇数(奇数尺寸才能拥有一个绝对的中心点)。论文中检测模型输入图像的分辨率为416×416,网络最后一层输出的特征图尺寸为13×13。

YOLOv2为每个anchor box预测所属的类别以及bounding box中含有目标的分数,因此YOLOv2可以预测出13×13×5=845个bounding box。

4、采用聚类的方法生成Anchor Boxes(Dimension Clusters)

在Faster R-CNN和SSD中,Anchor Box(长和宽)都是人为手动设定的。如果选取的Anchor Box比较适用于当前数据集,则模型更容易学习和收敛,从而得到更好的预测结果。因此,YOLOv2采用k-means聚类方法对训练集中的bounding box进行了聚类分析,从而获取更适合当前数据集的Anchor Box。因为Anchor Box的选定是为了使模型预测的bounding box更接近ground truth ,因此在进行k-means聚类时距离指标采用聚类中心(bounding box)与ground truth的IOU值:

个人理解:进行k-means时的ground truth(图像真实的bounding box)没有使用位置信息只使用了W和H信息(即:bounding box的宽和高),因此得到的中心点也只有W和H信息(即:Anchor box)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值