【论文笔记】An Analysis of Scale Invariance in Object Detection - SNIP (二)

Object Detection on an Image Pyramid

Scale Normalization for Image Pyramid

SNIP是由MST修改而来的模型,在上一节中作者指出MST效果不好的原因在于无法识别过大或过小的目标,而在SNIP中,我们使用224x224的分辨率(与pre-training的分辨率相近)来训练检测器。

SNIP在训练过程中只对特定尺度范围内的目标回传损失,但不对数据集进行过滤处理,是的模型能够补货所有appearnce和pose细节,从而减小了domain-shift带来的影响。

特定尺度范围是与pre-training数据相近的尺度,即224x224。

**注:**MST进行多尺度训练,因为一个物体总会有一个尺度落在指定范围内,只有这个落在指定范围内的物体参与了训练,其余部分在BP时忽略。

由Table1可以看出,SNIP与其他方法相比是优秀的。

SNIP示意图如下所示:

RPN训练

  1. 用所有的ground truth boxes给anchors和proposals分配标签。
  2. 对一个特定分辨率i下,定义范围[sc_i, ec_i],RoI落入此范围内的ground truth boxes记为valid,其余为invalid。
  3. 将与invalid_GT的RoI超过0.3的anchors标记为invalid anchors。

在测试阶段,用RPN生成各个分辨率下的proposals,并各自分类,与训练时相同,丢弃不在特定范围内的detections(not proposals)。

最后用soft-NMS讲个分辨率下的detections相加,得到最终结果。

Sampling Sub-images

考虑到GPU的显存限制,需要对图片进行crop。

  • 用最少数量的chips(sub-images),1000x1000,来囊括所有小目标。如果没有小物体就不需要计算,从而达到加速目的。
  • 1400x2000的图片进行采样,800x1200和480x640的途中没有小物体时不需要采样。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值