YOLO系列——yolov2

检测模型 = 特征提取器+检测头

一、yolov2

1、基本概念

yolov1的检测速度快,但是预测框不准确,很多目标找不到

  • 预测的框不准确
  • 目标找不到

问题 1:预测的框不准确

yolov1直接预测的是目标框的坐标(x,y,w,h),yolov2改进预测的是目标框的偏移量。直接预测位置会导致神经网络在一开始训练时不稳定,使用偏移量会使得训练过程过程更加稳定,性能指标提升。

  • 偏移量:

   

模型预测的值为:tx、ty、tw、th

模型最终的检测结果为:bx、by、bw、bh

\sigma =\frac{1}{1+e^{-x}}

cx、cy为grid左上角坐标,pw、ph为Anchor的宽高。

问题 2:很多目标找不到

将yolov1的 7 x 7 改为 13 x 13 区域,而且每个区域有5个Anchor(锚框),而且每个锚框对应一个类别。

1、为什么用Anchor

2、每个区域的5个Anchor是如何得到的呢

对训练集中的GT bounding box进行聚类,根据实验发现聚5类较合理

anchor是从数据集中统计获得的,Faster-RCNN中的Anchor的宽高和大小是手动挑选的。

2、yolov2的网络结构

2. 1 网络模型(Darknet-19)

       采用19个卷积层,5个池化层

2. 2 相对于yolov1的改进

(1)加入BN

      解决梯度消失和爆炸,起到一定的正则化效果

(2)使用高分别率图像,微调分类模型

      yolov1:训练使用224x224,测试:448x448

      yolov2:保持v1不变,但是在原训练的基础上加上(10个epoch)的448x448高分别率样本进行微调,测试用448x448。

(3)聚类使用先验框

         yolov2对训练集中所有标注的边界框进行聚类(5类),将每一类的中心中心实际值(w,h)作为先验Anchor

(4)相对偏移计算

(5)细粒度特性——提高对小目标的检测能力

        对不同层的特征进行融合,高分别率的浅层进行拆分叠加到低分辨率的深层特征

(6)多尺度检测

       每经过一定次数的迭代,可以进行输入图像尺度变化。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值