多级特征融合检测小目标的一些个人理解

最新推荐文章于 2025-04-14 22:50:37 发布

cici来自小蠡湖

最新推荐文章于 2025-04-14 22:50:37 发布

阅读量3.4k

点赞数 4

分类专栏：目标检测文章标签：目标检测图像处理人工智能

本文链接：https://blog.csdn.net/weixin_42354675/article/details/90719003

版权

目标检测专栏收录该内容

1 篇文章

订阅专栏

Feature-Fused SSD：Fast Detection for Small Objections
这篇文章是在SSD的基础上对于小目标的检测做了一些改进，取得了很好的效果。
小目标检测仍然是当下需要解决的问题。在发明SSD算法时，Wei liu 大神肯定是深知SSD的优点和缺点，故在SSD之后又以而作作者与Cheng Yang Fu联合发表了DSSD算法。在SSD卷积层之后，添加了辅助卷积层以及相对应的不对称的反卷积层。同时，将基础网络由VGG_16换成了Resnet101。显然，这样增强了特征的提取，但同时增加了计算量，不可避免的导致了速度的变慢。
由Guimei Cao等人提出的Feature-Fused SSD算法同样融合了上下文信息，但是它的基础网络仍然是VGG_16，与DSSD不同之处是利用融合高层的语义信息去感知低层的语义信息。
论文文章作者对各种高层的提取信息的能力进行了分别实验。

语义信息提取
从图中不难发现，层次越高，卷积层感知的范围会更深，但是到了Fc6层，不难发现，带来的背景噪音也会不可避免的变多。
随后便是对选取合适的层组合进行分别实验。作者首先对组合层的结构进行了说明。
作者设计了两种特征融合的模型。第一种是Concatenation Module：
在这里插入图片描述
为了使得Conv5_3能够与Conv_4有相同的尺寸，需要用双线性采样进行初始化，然后分别用两个3 * 3的卷积更好的学习所需融合的特征，随后归一化层分别遵循20，10的比例（个人猜测这个归一化层是为了能够使模型收敛，因为提取到的上下文信息可能是分散的），再分别经过激活函数后沿着通道相连。初次融合后，用1 * 1卷积生成最终的特征融合图，用于降维以及信息的更好的融合。
第二种是Element-Sum Module：在这里插入图片描述
与上面的Concatenation Module在不同层融合前的操作相同，不同之处在于采用了Resnet101中的利用反卷积后的信息与普通卷积后的元素信息进行想加。不难发现，Concatenation Module能做到的是可以减少背景噪声信息的干扰，Element-Sum Module所能做到的是增加上下文信息的感知。
实验结果
在这里插入图片描述
不难发现，采用Conv4_3与Conv5_3的融合采用第一种方法的精度最高。

kernel的选择在第一种方法选择512个，第二种方法选择384个。
接下来作者是利用PASCAL VOC2007进行测试的。

显然，特征融合的两种方法的整体mAP都是较高的，能够达到很高的精度。在这里插入图片描述
但是在速度方面，显然特征融合的方案更佳。
参考博客：
https://blog.csdn.net/zj15939317693/article/details/80599596
https://blog.csdn.net/zhangjunhit/article/details/78031452
https://blog.csdn.net/u010725283/article/details/79115477
这是本人第一次写算法理解，不当之处，谢谢指正。