特征融合和双路径注意模块

最新推荐文章于 2025-03-13 10:13:32 发布

MatpyMaster

最新推荐文章于 2025-03-13 10:13:32 发布

阅读量1.2k

点赞数 1

分类专栏： CV计算机视觉文章标签：计算机视觉深度学习人工智能目标检测

本文链接：https://blog.csdn.net/qq_41301570/article/details/134296158

版权

CV计算机视觉专栏收录该内容

43 篇文章

订阅专栏

本文介绍了一种结合语义和纹理特征的小物体检测方法，包括自顶向下的FFM模块、基于SE-Net的双路径注意模块(DAM)以及多尺度感受野(MRF)。FFM增强浅层特征，DAM有效抑制背景噪声，MRF捕捉多尺度信息，提高了模型对小目标的识别性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

01 特征融合模块

为了充分利用语义信息和纹理特征，设计了一个自顶向下的FFM，将语义信息引入浅层。FFM由1 × 1卷积和双线性插值上采样组成。FFM由1 × 1卷积和双线性插值上采样组成。然后，使用 1 × 1 卷积层压缩特征图的通道。最后，使用elementwise和将深层特征与浅层特征相结合。经过上述处理后，融合特征的通道保持不变，但单通道的语义信息更丰富。这些步骤丰富了浅层特征的语义信息，提高了小物体的模型性能。

02 双路径注意模块

由于特征图将通过几个卷积层连续压缩，小物体的信息在深层会较少，背景噪声也会覆盖它。因此，有必要抑制非对象信息。为了有效地捕捉小物体的信息并抑制背景噪声，设计了基于SE-Net块的DAM。

DAM由两个并行分支组成——空间注意分支和通道注意分支。使用空间注意分支来保留空间信息，并使用通道注意分支来抑制无用信息。通过重新加权输入特征图和注意力图来获得细化的映射。这样，关键特征将被突出显示，输入的背景噪声也会被抑制。

首先，在空间注意力分支中，使用 1 × 1 卷积来压缩通道，从而减少维度和计算。使用两个3 × 3卷积提取空间信息。通过sigmoid函数得到二维空间注意图FS∈RH ×W。使用 3 × 3 卷积的原因是因为它可以在保持感受野的同时减少计算量。

在通道注意力分支中，使用全局平均池化来聚合每个通道中的特征图。此外，设计了一个多层感知（MLP），它由两个全连接层和一个 ReLU 层组成，以计算每个通道特征的重要性权重。最后，1-D 的注意力图是通过 sigmoid 函数生成的。在参数设置过程中，第一个 FC 层设置为 FC ∈ RC/r×1×1，缩减率值为 16。

03 多尺度感受野

众所周知，CNN 的感受野表示特征图上像素映射到原始图像的区域大小。感受野越大，特征图中的全局信息越多。感受野越小，特征图中更详细的信息就越小。感受野也是影响检测性能的因素之一。

MRF旨在通过设置不同大小的并行卷积来捕获更多的多尺度特征。MRF由四个分支组成，分别使用1×1 Conv、3×3 Conv、5×5 Conv、7×7 Conv和平均池化来拓宽感受野。同时，使用 1×1 Conv 来压缩通道。此外，将 k × k Conv 分解为 1 × k Conv 和 k × 1 Conv。这样，保持感受野的大小不变，缩短AF-SSD的推理时间。MRF模块可以有效增强AD-SSD的浅层特征，检测小物体。

该方法包含三个MRF模块。更具体地说，将MRF添加到Res3d和Res5c分支中，并将C5层和C6层与MRF连接

注：本文仅用于学术分享，如有侵权，请联系后台作删文处理。

最后：

如果你想要进一步了解更多的相关知识，可以关注下面公众号联系~会不定期发布相关设计内容包括但不限于如下内容:信号处理、通信仿真、算法设计、matlab appdesigner，gui设计、simulink仿真......希望能帮到你！