SSD算法笔记

SSD:Single Shot MultiBox Detector

wei liu 在ECCV2016上发表,对于300*300网络使用Nvidia Titan X在VOC2007测试集上达到74.3%map以及59FPS。

Faster RCNN存在的问题

1。对小目标检测效果很差,只是在一个特征层预测,特征层已经被抽样到一个非常高的层次,细节信息保留就越少,比较抽象。

2。模型大,检测速度较慢,关键两步走,rpn和fasterrcnn共进行两次预测,twostage网络的通病。

9a12dd7256ad4744baab8a678a28fcf1.png

SSD

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBA5qmZ5a2Q5ZCWMjE=,size_20,color_FFFFFF,t_70,g_se,x_16

VGG16

对应VGG16中conv5_3,maxpooling前,

预测特征层一:对应vgg16conv4_3,将pool5由2*2-s2改成3*3-s1,特征矩阵高和宽不会改变和conv5_3保持一致。

预测特征层二:经过3*3*1024conv和1*1*1024

预测特征层三:经过1*1*256和3*3*512-s2

预测特征层四:经过1*1*128和3*3*256-s2

预测特征层五:经过1*1*128和3*3*256-s1

预测特征层六:经过1*1*128和3*3*256-s1

六个特征层预测不同目标,在第一个检测相对较小的目标,大目标相反

dbc3e410cf7c47439839bed065a50c48.png

8*8保留细节更多一些(猫),4*4 (狗)

Default Box的scal以及aspect设定

较大和较小的物体占少数,中等物体占多数

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzU5MzMzMA==,size_16,color_FFFFFF,t_70#pic_center

六个特征层先验框的个数为8732个,不同特征层上进行不同尺度预测所得的box基本可覆盖原图像

predictor的实现

对m*n*p的特征层都使用3*3*p的卷积核层进行预测

对每个box生成c(包括背景类别)个类别分数和4个坐标偏移量(在fasterrcnn中针对每个类别分4个回归参数),即(c+4)*kmn个

正负样本的选取

正样本

1.对每个gtbox匹配每个与它iou最大的defaultbox

2.对任意的defaultbox只要与任何一个gtbox的iou值大于0.5也认为是正样本

负样本

鉴于正样本个数有限,样本个数极不平衡,对于所有剩下的样本计算confidence loss选取排在前面的负样本,正负样本比例1:3

损失计算:类别损失和定位损失

8622c0c7e3cc4f61ad1b8442ad96802a.png

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值