多级特征融合检测小目标的一些个人理解

Feature-Fused SSD:Fast Detection for Small Objections
这篇文章是在SSD的基础上对于小目标的检测做了一些改进,取得了很好的效果。
小目标检测仍然是当下需要解决的问题。在发明SSD算法时,Wei liu 大神肯定是深知SSD的优点和缺点,故在SSD之后又以而作作者与Cheng Yang Fu联合发表了DSSD算法。在SSD卷积层之后,添加了辅助卷积层以及相对应的不对称的反卷积层。同时,将基础网络由VGG_16换成了Resnet101。显然,这样增强了特征的提取,但同时增加了计算量,不可避免的导致了速度的变慢。
由Guimei Cao等人提出的Feature-Fused SSD算法同样融合了上下文信息,但是它的基础网络仍然是VGG_16,与DSSD不同之处是利用融合高层的语义信息去感知低层的语义信息。
论文文章作者对各种高层的提取信息的能力进行了分别实验。

语义信息提取
从图中不难发现,层次越高,卷积层感知的范围会更深,但是到了Fc6层,不难发现,带来的背景噪音也会不可避免的变多。
随后便是对选取合适的层组合进行分别实验。作者首先对组合层的结构进行了说明。
作者设计了两种特征融合的模型。第一种是Concatenation Module
在这里插入图片描述
为了使得Conv5_3能够与Conv_4有相同的尺寸,需要用双线性采样进行初始化,然后分别用两个3 * 3的卷积更好的学习所需融合的特征,随后归一化层分别遵循20,10的比例(个人猜测这个归一化层是为了能够使模型收敛,因为提取到的上下文信息可能是分散的),再分别经过激活函数后沿着通道相连。初次融合后,用1 * 1卷积生成最终的特征融合图,用于降维以及信息的更好的融合。
第二种是Element-Sum Module在这里插入图片描述
与上面的Concatenation Module在不同层融合前的操作相同,不同之处在于采用了Resnet101中的利用反卷积后的信息与普通卷积后的元素信息进行想加。不难发现,Concatenation Module能做到的是可以减少背景噪声信息的干扰,Element-Sum Module所能做到的是增加上下文信息的感知。
实验结果
在这里插入图片描述
不难发现,采用Conv4_3与Conv5_3的融合采用第一种方法的精度最高。
在这里插入图片描述
kernel的选择在第一种方法选择512个,第二种方法选择384个。
接下来作者是利用PASCAL VOC2007进行测试的。
在这里插入图片描述
显然,特征融合的两种方法的整体mAP都是较高的,能够达到很高的精度。在这里插入图片描述
但是在速度方面,显然特征融合的方案更佳。
参考博客:
https://blog.csdn.net/zj15939317693/article/details/80599596
https://blog.csdn.net/zhangjunhit/article/details/78031452
https://blog.csdn.net/u010725283/article/details/79115477
这是本人第一次写算法理解,不当之处,谢谢指正。

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值