SSD源码总结

一、生成默认框

默认框的宽高

默认框的宽高是相对于原图的尺寸计算出来的。

默认框的中心

默认框的中心是相对于特征图的尺寸计算出来的。

二、将真实框分配给默认框

1、区分正负样本

1.1、选取正样本

计算真实框(bboxs)与每个默认框(dboxs)的IOU,如图。

 第一条准则是选择与真实框IOU最大的默认框,将其置为正样本。

第二条准则是选择与真实框IOU大于0.5的默认框,将其置为正样本。

对于被置为正样本的默认框,将其标签和坐标改为相匹配的真实框的标签和坐标。

2.2、选取负样本

非正样本的默认框就是负样本,负样本的默认框的标签和坐标不用发生变化。

三、特征提取

网络结构

生成六个特征图 

四、特征预测

设每个特征图的位置上会生成k个默认框,对上一步生成的六个特征图,k=[4,6,6,6,4,4] 。

采用3x3的卷积对特征图进行预测,例如,对于第一个特征层,进行3x3卷积之后,如果预测的为坐标信息,则预测后的通道数为4xk(即4x4),得到的shape为 [batch_size,4xk,特征图长,特征图宽] ,再通过.view方法将shape重塑为[batch_size,4,k x 特征图长 x 特征图宽],即得到该特征图的每一个默认框坐标信息的预测值。

五、计算损失(训练模式)

定位损失

标签损失

直接计算预测标签和真实标签的损失是不合理的,因为负样本的数量远远多于正样本的数量,因此要对负样本进行筛选,筛选的方法就是根据置信度损失对负样本进行降序排序,选取置信度高的负样本,得到负样本掩码,再和正样本掩码相加,乘以整体的标签损失,最终得到标签损失。

六、后处理(预测模式)

首先通过预测的boxes回归参数得到最终预测坐标, 将预测目标score通过softmax处理。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值