背景
- 小目标效果差的原因:只对backbone最后一层的feature map进行rpn,最后这个map细节信息丢失严重。
SSD模型
步距为2时,padding为1,步距为1的时候,padding为0
与faster-rcnn的区别是把box放在不同的特征层
预测器和fast-rcnn基本类似,在每一个特征层上使用3x3 的卷积核来进行预测,需要ck+4k个卷积核
与fast-rcnn不同,这里是对每个default-box都生成4个边界框回归参数,不区分类别,即4k。
而fast-rcnn是每个achor会针对每个类别都会生成相应的边界框回归参数,即4ck。
- 正样本
- 对每个gt-box去匹配最大的default-box
- 对于任意一个default-box,只要它与任意一个gt-box的iou大于0.5
- 负样本:
- 在剩下的所有样本中计算最大confidence loss(这个值越大意味着网络将这个box预测为目标的概率就越大,这是我们应该拒绝的),所以就要选取这些值较大的box作为负样本
- 正负样本1:3
【参考】
b站:霹雳吧啦Wz