【文献阅读5】Small Object Detection using Context and Attention

最新推荐文章于 2024-11-07 20:21:28 发布

Mr小米周

最新推荐文章于 2024-11-07 20:21:28 发布

阅读量4k

点赞数 7

分类专栏：文献阅读计算机视觉文章标签：计算机视觉深度学习

原文链接：https://arxiv.org/abs/1912.06319v2

版权

17 篇文章 3 订阅

订阅专栏

8 篇文章 4 订阅

订阅专栏

我的总结

本篇仅是简单阅读记录！！！

为了提高小目标检测的精度，本文提出一种利用上下文的目标检测方法。
该方法通过连接多尺度特征，使用来自不同层的附加特征作为上下文。
还提出了具有注意力机制的目标检测，该机制可以聚焦于图片中的目标，并且可以包含来自目标层的上下文信息。

目标检测的mAP较高了，但小目标mAP较低，SSD小目标检测mAP只能达到20.7%，还有很大的提升空间。
小目标检测难的原因是低分辨率和有限的像素。
把上下文信息作为额外的信息可以帮助小目标检测。

第一，为了提供足够的关于小对象的信息，作者通过利用来自更高层的更抽象的特征作为对象的上下文，从小对象的周围像素中提取上下文信息。通过连接小对象的特征和上下文的特征，我们增加了小对象的信息，使得检测器可以更好地检测对象。
第二，为了专注于小对象，作者在早期层使用了一种注意力机制。这也有助于减少背景中不必要的浅层特征信息。在作者的实验中，作者选择SSD作为基线。然而，这个想法可以推广到其他网络。

深度学习目标检测：

小目标检测：

数据扩充，减小大目标尺寸，解决数据不足的问题
反卷积技术放大特征图，DSSD反卷积所有特征图，模型复杂度变高，速度降低；R-SSD通过池化和反卷积混合不同尺寸的特征图，相较于DSSD速度精度皆有提升
以低分辨率的特征作为GAN的输入，获得高分辨率的特征

视觉注意力网络：

SSD：
其思想是利用早期特征图的较高分辨率来检测较小的物体，而利用分辨率较低的较深特征来检测较大的物体。
小目标检测精确度仍较差，原因：

F-SSD：
为了给作者想要检测对象的给定特征图(目标特征)提供上下文，作者将其与来自目标特征层的更高层的特征图(上下文特征)相融合。

目标特征：【Conv4_3】–【3X3卷积，padding=1，stride=1，尺寸不变；BN；ReLU】–【融合：Stack堆叠融合】
上下文特征1：【Conv7】–【反卷积deconvolution：将上下文特征转换为与目标特征尺寸一致】–【融合】
上下文特征2：【Conv8_2】–【反卷积deconvolution】–融合

注：Batch Normalization 与 L2 Normalization
详细解释见连接：https://blog.csdn.net/weixin_30344795/article/details/94804119