目标检测之YOLO3

前言

YOLO从诞生起就被贴上了两个标签:速度快,小物体检测率低。而在YOLO3中对小物体的检测有了较大的提升。看一下对比:

接下来介绍YOLO3究竟使用了什么黑科技?

YOLO3

先贴几段JR在论文中骚话:

 

 1、Class Prediction

作者在YOLO3替换了YOLO2的softmax loss 变成binary cross-entropy loss,由于每个点所对应的bounding box少并且差异大,每个bounding与ground truth的matching策略变成了1对1。当预测的目标类别很复杂的时候,采用binary cross-entropy loss进行分类是更有效的,比如在Open Images Dataset数据集进行分类。在这个数据集中,会有很多重叠的标签,比如女人、人,如果使用softmax则意味着每个候选框只对应着一个类别,但是实际上并不总是这样。复合标签的方法能对数据进行更好的建模。

2、Predictions Across Scales

YOLO3增加了top down 的多级预测,解决了YOLO颗粒度粗,对小目标无力的问题。v2只有一个detection,v3一下变成了3个,分别是一个下采样的,feature map为13*13,还有2个上采样的,feature map为26*26,52*52。这应该是对小目标影响最大的地方。在论文中从单层预测五种bounding box变成每层3种bounding box;

3、Feature Extractor

使用加深的Darknet-53进行特征提取。网络结构如下:

它比Darknet-19更强大,同时比Res-Net101更有效率。

总结

YOLO3可以说是当前非常好的目标检测算法,很快而且很准确。YOLO在形成过程中,不断学习别人。在YOLO2吸收faster-rcnn中anchors概念,仿Res-Net的Darkent-19。在YOLO3中学习SSD多尺度区域特征,最终进化到第三阶段,终极状态又会是怎么样呢?让我们拭目以待。下节将要介绍SSD。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值