【目标检测】YOLOv2

最新推荐文章于 2022-09-27 17:09:18 发布

YFR718

最新推荐文章于 2022-09-27 17:09:18 发布

阅读量205

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/YFR718/article/details/115178785

版权

深度学习专栏收录该内容

8 篇文章 1 订阅

订阅专栏

更快更强

在这里插入图片描述

网络结构

YOLOv2 采用 Darknet-19 作为特征提取网络，其整体结构如下：

改进方法

（1）加入BN，提升2个点
（2）更高分辨率，v1 224224，v2 448448.提升4%
（3）引入 Anchor Box 机制
在YOLOv1中，作者设计了端对端的网路，直接对边界框的位置（x, y, w, h）进行预测。这样做虽然简单，但是由于没有类似R-CNN系列的推荐区域，所以网络在前期训练时非常困难，很难收敛。于是，自YOLOv2开始，引入了 Anchors box 机制，希望通过提前筛选得到的具有代表性先验框Anchors，使得网络在训练时更容易收敛。

预测边界框中心点相对于该网格左上角坐标（ Cx , Cy ）的相对偏移量，同时为了将bounding box的中心点约束在当前网格中，使用 sigmoid 函数将 t x , t y 归一化处理，将值约束在0-1，这使得模型训练更稳定。
在这里插入图片描述

（4）Dimension Cluster：K-means获取Anchor
（5）PassThrough Layer ，提升1%

细粒度特征，可理解为不同层之间的特征融合。YOLOv2通过添加一个Passthrough Layer，把高分辨率的浅层特征连接到低分辨率的深层特征（把特征堆积在不同Channel中）而后进行融合和检测。具体操作是：先获取前层的26×26的特征图，将其同最后输出的13×13的特征图进行连接，而后输入检测器进行检测（而在YOLOv1中网络的FC层起到了全局特征融合的作用），以此来提高对小目标的检测能力。

Passthrough层与ResNet网络的shortcut类似，以前面更高分辨率的特征图为输入，然后将其连接到后面的低分辨率特征图上。前面的特征图维度是后面的特征图的2倍，passthrough层抽取前面层的每个2×2的局部区域，然后将其转化为channel维度，对于26×26×512的特征图，经Passthrough层处理之后就变成了13×13×2048的新特征图（特征图大小降低4倍，而channles增加4倍），这样就可以与后面的13×13×1024特征图连接在一起形成13×13×3072的特征图，然后在此特征图基础上卷积做预测。

（6）多尺度训练

（7）Convolution With Anchor Boxes

在这里插入图片描述

YOLOv1 有一个致命的缺陷就是：一张图片被分成7×7的网格，一个网格只能预测一个类，当一个网格中同时出现多个类时，就无法检测出所有类。针对这个问题，YOLOv2做出了相应的改进：

首先将YOLOv1网络的FC层和最后一个Pooling层去掉，使得最后的卷积层的输出可以有更高的分辨率特征。
然后缩减网络，用416×416大小的输入代替原来的448×448，使得网络输出的特征图有奇数大小的宽和高，进而使得每个特征图在划分单元格的时候只有一个中心单元格（Center Cell）。YOLOv2通过5个Pooling层进行下采样，得到的输出是13×13的像素特征。
借鉴Faster R-CNN，YOLOv2通过引入Anchor Boxes，预测Anchor Box的偏移值与置信度，而不是直接预测坐标值。
采用Faster R-CNN中的方式，每个Cell可预测出9个Anchor Box，共13×13×9=1521个（YOLOv2确定Anchor Boxes的方法见是维度聚类，每个Cell选择5个Anchor Box）。比YOLOv1预测的98个bounding box 要多很多，因此在定位精度方面有较好的改善。

YFR718

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【目标检测】YOLOv2

更快更强网络结构改进方法（1）加入BN，提升2个点（2）更高分辨率，v1 224224，v2 448448.提升4%（3）引入 Anchor Box 机制在YOLOv1中，作者设计了端对端的网路，直接对边界框的位置（x, y, w, h）进行预测。这样做虽然简单，但是由于没有类似R-CNN系列的推荐区域，所以网络在前期训练时非常困难，很难收敛。于是，自YOLOv2开始，引入了 Anchors box 机制，希望通过提前筛选得到的具有代表性先验框Anchors，使得网络在训练时更容易收敛。预
复制链接

扫一扫

专栏目录