小目标检测——An Analysis of Scale Invariance in Object Detection – SNIP

文章探讨了小目标检测的挑战,分析不同尺度影响及现有解决方案,提出Scale Normalization策略。通过多尺度训练结合尺度约束,优化图像金字塔上的目标检测性能,减少domain shift问题。
摘要由CSDN通过智能技术生成


  之前参加的人头计数比赛,包含比较小的人头,最小的gtbox的尺度只有4个像素点,大部分人脸检测算法的anchor最小设置为16个像素点,较难检测到,为了解决这个问题,看了这篇论文,了解到小目标检测一般是怎么解决的。

文章的出发点就是小目标一直目标检测的难点,论文分析了目前在极端尺度变化下识别和检测物体的不同技术,对比,然后提出了一个新颖的训练策略:Scale Normalization。
  在这里插入图片描述
  尺度变化,尤其是小目标检测,一直是物体检测的难点,在ImageNet和COCO中,物体实例中等尺度的比例是0.554和0.106,所以在COCO中大多数物体均是小尺寸的或者是极端尺寸。
  检测器需要处理的目标尺度变化时很大的,是CNN尺度不变属性的一个很大的挑战,尺度的变化导致了domain-shift。
  目前为了缓解尺度变化和小目标的问题,现在已经提出了很多的方法:

  • 浅层特征与深层特征融合来检测小目标
  • dilated/deformable convolution 用来增大感受野以提升大目标的检测
  • 在不同分辨率的层做独立的预测来获取不同的尺度
  • 上下文信息来对模棱两可的情况做分辨
  • 多尺度训练
  • 多尺度测试
  • NMS预测
    目前还有一些跟训练相关的重要的点没有提出:
  • 上采样图片能够保持好的性能吗?数据集中形状是480x640,为什么要上采样到800x1200。我们可以在低分辨率的图中用更小的stride预训练吗?
  • 当finetune的时候,训练物体实例的分辨率的应该在一定范围之内(64x64 - 256x256)吗?在适当rescale输入图片之后(上采样图片),所有分辨率的物体都参与训练吗?

不同尺度的影响(Image classification at multiple scales)

出发点:在state-of-the-arts的检测器上做实验(一

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值