SSD系列算法原理

·主干网络:VGGNet

·多尺度FeatureMap预测

·Defaul bounding boxes的类别分数、偏移量

主干网络介绍:

  • VGG、ResNet、MobileNets等,各种卷积神经网络
  • 将VGG最后两个FC改成卷积,并增加4个卷积层:(因为原始的网络是处理分类任务,而目标检测不需要)

多尺度FeatureMap预测:

  • 不同层的feature map
  • Prior box:类别概率和坐标(x,y,w,h)

PriorBoxLayer:

  • m*n个cell(feature map上的每个点都作为一个cell)
  • 每个cell上生成固定scale和aspect ratio的box:
  1. 假设一个feature map有m×n个cell, 每个cell对应k个default box;每个default box预测c个类别score和4个offset
  2. (c+4) *k*m*n个输出

看一下prior box是如何生成的:

shape数量越多,效果越好

38*38*4+19*19*6+10*10*6+5*5*6+3*3*4 +1*1*4=8732个prior box(具体会在配置文件中进行配置)

  • 每一个feature map cell不是k个defaoult box都取
  • prior box与GT box做匹配,IOU>阈值为正样本,IOU<负样本阈值为负样本,对于处于中间阈值的样本可以忽略掉
  • 训练:确保prior box的分类准确且尽可能回归到GT box

样本构造:

正样本:

从GT box出发给找到最匹配的prior box放入候选正样本集

从prior box集出发,寻找与GT box满足IOU>0.5的最大prior box放入候选正样本集

负样本:

难例挖掘

正负样本比:1:3(IOU<设定的阈值为负样本)

通过下面的过程就能讲loss较高的样本挖掘出来。

数据增强:

  • 随机采样多个path,与物体之间最小的jaccard overlap(IOU)为:0.1 ,0.3,0.5,0.7与0.9
  • 采样的patch比例是[0.3,1.0],aspect ratio在0.5或2
  • GT box 中心在采样patch中且面积大于0
  • Resize到固定大小
  • 以0.5的概率随机的水平翻转

损失函数:

  • 分类loss+回归loss
  • 分类loss: Softmax Loss
  • 回归损失:Smooth L1 Loss

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值