one stage目标检测算法介绍

使用CNN卷积特征,进行特征抽取。

直接回归物体的类别概率和位置坐标(无RPN网络)

准确度低/速度相对two stage快

one stage 基本流程

one stage 目标检测算法在给定输入后,会通过一个主干网络完成特征的抽取,然后会直接进行区域的回归以及目标的分类。相对于two stage最大的区别就是是否包含了候选区域推荐的过程,流程上更加简单,速度更快。

One stage常见算法

Yolo v1/v2/v3

SSD/DSSD等

Retina-Net

等等

One stage核心组件

CNN网络:不管是目标检测,分类还是回归都需要cnn网络,也就是主干网络。

回归网络:这里的回归网络不是简单的回归,可能会有一些相应的策略。实际上one stage核心的思想或者说创新点就体现在回归网络上。对于ssd yolo等,在设计回归网络上会有些相应的技巧。

CNN网络设计原则:

·从简到繁再到简的卷积神经网:在不考虑模型大小计算速度的情况下,通常选择复杂的模型来提高网络性能;如果在考虑计算性能尽可能快、模型尽可能小的情况下通常选择第二个“简”

·多尺度特征融合的网络:是目前在设计主干网络可能会用到的网络结构

·更轻量级的CNN网络:能降低功耗,降低模型推理用的时间。轻量级的网络在确保深度的情况下结构和参数量更少。参数量越少意味着模型更加不容易过拟合

回归网络:

回归网络的输入是主干网络处理得到的特征图。回归网络主要完成了区域回归和目标区域类别的判定。

区域回归:是指通过回归网络直接输出目标bounding box的位置信息。这个区域信息也是整个检测网络最终想要得到的目标,区域回归是整个one stage网络最终要的组件。除了位置外还会得到 置信度(表达了当前的bbox中是否存在目标)、类别

Anchor机制(ssd):是RPN网络的核心组件,对于one stage整个架构中没有RPN网络来做区域推荐提取,但有其中的核心思想。SSD中anchor有着非常重要的作用,yolo v1中没有anchor机制。

回归网络预测过程(Yolo):

对于Yolo而言,进行回归网络计算时会对图片进行划分,划分为s*s个网格,针对每个网格分别预测以当前网格为中心的目标区域的位置信息,认为当前的格子为矩形框的中心,在预测完中心后给出矩形框的宽和高。除了预测bbox外,每个格子还预测当前格子中是否存在目标的概率值。如果类别数为C类,Yolo中最后预测的值为((置信度+4个bbox信息)×bbox数+C类)×S×S。最终通过NMS得到最终得输出。

相比于two stage算法,one stage算法整个是一个纯粹的端到端的回归网络,整个流程也更加简单,效率更高。

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值