目标检测 YOLO 系列: 更快更准 YOLO v2

YOLO v2是YOLO系列的改进版,采用了Darknet-19作为backbone,引入BN操作和多尺度训练策略,提高了目标检测的速度和精度。网络结构中去除了fc层,使用了shortcut,并通过k-means计算得到anchor。损失函数仍分为位置、置信度和分类损失,但实现上有改进。
摘要由CSDN通过智能技术生成

目标检测 YOLO 系列: 更快更准 YOLO v2

作者:Joseph Redmon, Ali Farhadi
发表时间:2016
Paper 原文: YOLO9000: Better, Faster, Stronger

Joseph Redmon 等于 2016 年在 YOLO9000: Better, Faster, Stronger 中提出了 YOLO 的改进版本 YOLO V2 和 YOLO9000,其中 YOLO9000 是在 YOLO V2 的基础上采用联合训练的方式,使其可以检测超过 9000 个种类的物体的检测模型。这里重点介绍 YOLO V2。

YOLO V2 出来的时候 SSD 已经提出来了,Faster RCNN 就更早了,所以 V2 论文中以 Faster RCNN 和 SSD 作为 benchmark。

1 网络结构

首先是 backbone, V2 的 backbone 不再是 GoogLeNet v1,而是作者自己设计的一个网络,叫做 Darknet-19,这个网络的特点是网络结构小巧,但是性能表现却很不错。更多关于 Darknet-19 的介绍可以参考 CV 经典主干网络 (Backbone) 系列: Darknet-19

先来看一下 YOLO v2 的网络结构图。如下所示。

在这里插入图片描述

从上图可以发现,v2 的整体结构依然清爽。和 v1 相比除了 backbone 从 GoogLeNet v1 变为了 Darknet-19 之外,还有如下两点变化:

  • 网络中没有 fc 层了
  • 多了一条类似 ResNet 中的 shortcut(图中红色的连接),作者表示这一操作提升了1%的成绩。

在这里插入图片描述

更详细的网络结构如下。v2 总共有 22 个 conv. 层,没有 fc 层。相比 v1 的 24 个 conv. ,2 个 fc 层相比, v2 网络更小,这也是为什么v2 的速度能够更快的原因

从下表可以发现,网络的输入图片尺寸发生了变化,v1 的输入尺寸是 448x448,但是 v2 这里是 416×416,这主要是为了让网络最后得到一个奇数的 feature map(13x13)。

在这里插入图片描述

此外和 v1 相比 stride 变为 32(v1 为 64),可以得到更大的 feature map(13x13, v1 为 7x7),这样将有利于检测小目标。

更进一步的,以 Convolution-22 层为例,可以看到作者引入了 BN 操作。作者在论文中表示这一改进提升了2%的成绩。

[convolutional]
batch_normalize=1
size=3
stride=1
pad=1
filters=1024
activation=leaky

除了上面在网络结构中体现的涨分点之外,作者还采用了如下的训练技巧。

  • High Resolution Classifier,训练分类预训练模型时采用 224x224,但是在训练检测模型的时候用的是 448x448,但是这种直接切换分辨率的做法,检测模型可能难以快速适应高分辨率,所以作者在训练完预训练分类模型后,采用 448x448 的输入再 finetune 10 个 epoch,这样有助于改善这一状况。使用高分辨率分类器后,YOLOv2 的 mAP 提升了约 4%。
  • Multi-Scale Training,由于 YOLOv2 模型中只有卷积层和池化层,所以 YOLOv2 的输入可以不限于 416x416 大小的图片。为了增强模型的鲁棒性,YOLOv2 采用了多尺度输入训练策略,具体来说就是在训练过程中每间隔一定的 iterations(作者取 10) 之后改变模型的输入图片大小。由于 YOLOv2 的下采样总步长为 32,输入图片大小选择一系列为32倍数的值: 320 , 352 , . . . 608 {320,352,...608}
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值