小目标检测的解决办法

在深度学习目标检测中,由于小目标分辨率低,图片模糊,信息少,噪声多所以是一个实际且常见的困难问题

解决方法:使用不同分辨率的图像金字塔,再对每层金字塔用固定输入分辨率的分类器在该层滑动来检测目标,以求在金字塔底部检测出小目标;或者只用一个原图,在原图上,用不同分辨率的分类器来检测目标,以求在比较小的窗口分类器中检测到小目标。
参考1

1.[将图像resize成不同的大小]
(http://xxx.itp.ac.cn/ftp/arxiv/papers/1604/1604.02878.pdf)

2.data augmentation:对小目标进行数据增强
1>过采样策略oversampling,改变采样率
2>针对同一张图片里面包含小目标数量少的问题,在图片内用实例分割的Mask抠出小目标图片再使用复制粘贴的方法(当然,也加上了一些旋转和缩放,另外要注意不要遮挡到别的目标)

3.特征金字塔网络FPN
浅层特征图感受野小适合小目标检测,深层特征图感受野大适合大目标检测

4.人脸检测SSH、Feature-Fused SSD、Deconvolutional Network

5.合适的训练方法‘’模型预训练的分布要尽可能地接近测试输入的分布‘’SNIP(An Analysis of Scale Invariance in Object Detection)训练时只训练合适尺寸的目标样本,只有真值的尺度和Anchor的尺度接近时来用来训练检测器,太小太大的都不要,预测时输入图像多尺度,总有一个尺寸的Anchor是合适的,选择那个最合适的尺度来预测,SNIPER,SAN,R-FCN

6.更稠密的Anchor采样和匹配策略S3FD,FaceBoxes
1>FaceBoxes:Inception3的anchors有三个scales(32,64,128),而32 scales是稀疏的,所以需要密集化4倍,而64 scales则需要密集化2倍
2>在S3FD人脸检测方法中,则用了Equal-proportion interval principle来保证不同大小的Anchor在图中的密度大致相等,

7.对小目标的Anchor使用比较宽松的匹配策略(比如IoU > 0.4),总之就是从anchor的密度,anchor的范围,anchor的形状数量来考虑,具体理解可参看2

8.GAN方法:使用GAN对小目标生成一个和大目标很相似的Super-resolved Feature,然后把这个Super-resolved Feature叠加在原来的小目标的特征图上,以此增强对小目标特征表达来提升小目标的检测性能。【Perceptual GAN】

9.利用Context信息的Relation Network和PyramidBox
比如检测人脸时,图片中不会仅仅只有一张脸,会有肩膀胳膊等,可以利用这些上下文信息,目标就变大了

10.ROI pooling和Context-Aware RoI Pooling,ROI align

11.回归损失函数:不同大小的目标大小给不同的损失函数加权系数

12.增大小目标的GT,从而变相加大目标。增加检测能力

13.Lucid Data Dreaming for Multiple Object Tracking,这是一种在视频跟踪/分割里面比较有效的数据增强手段,据说对于小目标物体检测也很有效。

参考3参考4

  • 5
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测计算机视觉领域中的一个重要任务,它的目标是在图像或视频中准确地识别和定位出感兴趣的目标物体。而小目标检测问题则是指在目标检测任务中,需要检测和定位那些尺寸较小的目标物体。 小目标检测问题具有以下挑战: 1. 尺寸小:小目标通常具有较小的尺寸,可能只有几个像素大小,这使得它们在图像中很难被准确地检测和定位。 2. 低分辨率:小目标通常在图像中具有较低的分辨率,这会导致目标的细节信息丢失,增加了检测的难度。 3. 目标形状变化:小目标可能具有多样的形状和变化,例如旋转、扭曲等,这增加了目标检测算法的复杂性。 4. 背景干扰:小目标通常位于复杂的背景中,背景干扰可能会掩盖目标或引入误检,使得检测更加困难。 为了解决小目标检测问题,研究者们提出了一系列的方法和技术,包括但不限于: 1. 特征提取:使用更加鲁棒的特征提取方法,例如基于深度学习的卷积神经网络(CNN),可以提取更具有区分度的特征,增强小目标的检测性能。 2. 多尺度检测:通过在不同尺度上进行目标检测,可以提高对小目标的检测能力。例如,使用图像金字塔或多尺度滑动窗口的方法来检测不同尺度的目标。 3. 上下文信息利用:利用目标周围的上下文信息,例如背景信息、语义信息等,可以提高对小目标的检测准确性。例如,使用上下文感知的特征或上下文信息引导的注意力机制。 4. 数据增强:通过对训练数据进行增强,例如旋转、缩放、裁剪等操作,可以模拟小目标在不同场景下的变化,提高模型的泛化能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值