SSD针对小物体检测效果不好的现象的思考

SSD针对小物体检测效果不好的现象的思考

最近在用ssd-caffe进行物体检测,但是在使用的过程中,发现ssd对小物体的检测效果很不好。
阅读了为什么SSD(Single Shot MultiBox Detector)对小目标的检测效果不好?这篇blog,感觉还是体会很深,所以就该blog进行以下探讨~~~~

一、 问题的出现

首先,为什么会出现SSD针对小物体检测效果不好的现象?
答:
SSD-CAFFE网络框架采用的是VGG16作为backbone,而ssd采样了conv4_3,fc7…conv9_2等六个特征层作为有效特征层。而越靠前的有效特征层的作用就是检测越小的物体,就比如说conv4_3就是检测最小物体的有效特征层。所以说,conv4_3包含的语义信息就是小物体的图片信息,但是同时就会出现一个很大的问题,靠前的特征层由于卷积次数较少,导致其相对于靠后的有效特征层来说包含的语义信息较少。小物体的特征信息收集不全面,当然预测效果也就会不好。
还有一点,一般来说,ssd喂进网络都会先将图片resize到一定尺寸,例如ssd_300x300,ssd_512x512,同时小物体的尺寸也会随着减少,甚至一些很小的物体进行压缩之后就会失真,所以说也会在一定程度上破坏预测的小物体的特征,从而影响对小物体的预测效果。

二、尝试解决

1.添加FPN层
请添加图片描述
yolo对小物体检测效果较好的原因,很大程序就在于内部采用了FPN模块,前面阐述了越靠前的有效特征层包含的语义信息就越不匮乏。采用FPN模块,将靠后的有效特征层进行上采样,然后与其前一层的有效特征层进行channals维度叠加,然后利用卷积将调整channals的维度。同理,基于上述进行fpn的有效特征层和前前一个特征层进行fpn,以此类推…最后得到的conv4_3就是经过层层上采样得到的有效特征层。该特征层包含了靠后所有的有效特征层的语义信息,从而就避免了因为卷积次数不够所导致的语义信息匮乏现象


2.降低PriorBox最小最大尺寸

layer {
  name: "conv4_3_norm_mbox_priorbox"
  type: "PriorBox"
  bottom: "conv4_3_norm"
  bottom: "data"
  top: "conv4_3_norm_mbox_priorbox"
  prior_box_param {
    min_size: 51.2000007629
    max_size: 102.400001526
    aspect_ratio: 2.0
    flip: true
    clip: false
    variance: 0.10000000149
    variance: 0.10000000149
    variance: 0.20000000298
    variance: 0.20000000298
    step: 8.0
    offset: 0.5
  }
}

上述是基于conv4_3生成的预选框层,min_size和max_size是该有效特征层所生成的预选框的最大最小尺寸,只要减少其尺寸,就能够提高对小物体的预测效果。


3.增加有效特征层size
VGG中在conv4_3前面进行了三次卷积激励池化,每一次池化都进行了一次下采样。可以通过降低池化次数,提高卷积次数,来保证有效特征层的size的提高。一旦有效特征层的size变大,那么有效特征层中每一个像素点所代表的原图尺寸就随着变小,从而提高对小物体的预测效果。

ps:个人见解,欢迎指教~

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

进我的收藏吃灰吧~~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值