ssd网络结构_论文阅读:SSD

一、对网络的理解

1、SSD网络结构

17ac12892367023adeb2d3f4f873adeb.png

这个网络主要是利用了不同层的feature map,不同层的feature map尺寸大小不一样,尺寸随feature map层数增加线性增加,可以用于产生不同尺寸的先验框,再加上同一种尺寸下不同长宽比的先验框,6个feature map的情况下用可以产生8732个先验框,覆盖范围非常广。

其中,先验框的产生是利用小的卷积核去卷积feature map,所以产生先验框的同时可以预测框的坐标 大小 以及对应类别的置信度,一次齐活,没有faster rcnn的roi pooling那个阶段,不用二次利用feature map。

还有一点是 利用了data augmentation,使得map提升将近10%,论文中有数据说明。data augmentation就主要是利用目标的部分作为整张图像进入网络,使得网络对目标的细节捕捉能力变强。

2、SSD的基础网络是VGG16,其中fc6 fc7被改成卷积层,dropout和fc8被去掉,conv6用到了膨胀卷积增加感受野。

VGG16中的Conv4_3层将作为用于检测的第一个特征图。conv4_3层特征图大小是 38*38 ,但是该层比较靠前,其norm较大,所以在其后面增加了一个L2 Normalization层(参见ParseNet),以保证和后面的检测层差异不是很大,这个和Batch Normalization层不太一样,其仅仅是对每个像素点在channle维度做归一化,而Batch Normalization层是在[batch_size, width, height]三个维度上做归一化。归一化后一般设置一个可训练的放缩变量gamma。

从后面新增的卷积层中提取Conv7,Conv8_2,Conv9_2,Conv10_2,Conv11_2作为检测所用的特征图,加上Conv4_3层,共提取了6个特征图。

3、网络的输出检测值 包含两个部分:类别置信度和边界框位置,各对6个feature map采用一次 33 卷积来进行完成。令 k为该特征图所采用的先验框数目,那么类别置信度需要的卷积核数量为k<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值