特征融合和双路径注意模块

本文介绍了一种结合语义和纹理特征的小物体检测方法,包括自顶向下的FFM模块、基于SE-Net的双路径注意模块(DAM)以及多尺度感受野(MRF)。FFM增强浅层特征,DAM有效抑制背景噪声,MRF捕捉多尺度信息,提高了模型对小目标的识别性能。
摘要由CSDN通过智能技术生成

图片

图片

01 特征融合模块

为了充分利用语义信息和纹理特征,设计了一个自顶向下的FFM,将语义信息引入浅层。FFM由1 × 1卷积和双线性插值上采样组成。FFM由1 × 1卷积和双线性插值上采样组成。然后,使用 1 × 1 卷积层压缩特征图的通道。最后,使用elementwise和将深层特征与浅层特征相结合。经过上述处理后,融合特征的通道保持不变,但单通道的语义信息更丰富。这些步骤丰富了浅层特征的语义信息,提高了小物体的模型性能。

图片

02 双路径注意模块

由于特征图将通过几个卷积层连续压缩,小物体的信息在深层会较少,背景噪声也会覆盖它。因此,有必要抑制非对象信息。为了有效地捕捉小物体的信息并抑制背景噪声,设计了基于SE-Net块的DAM。

图片

DAM由两个并行分支组成——空间注意分支和通道注意分支。使用空间注意分支来保留空间信息,并使用通道注意分支来抑制无用信息。通过重新加权输入特征图和注意力图来获得细化的映射。这样,关键特征将被突出显示,输入的背景噪声也会被抑制。

图片

首先,在空间注意力分支中,使用 1 × 1 卷积来压缩通道,从而减少维度和计算。使用两个3 × 3卷积提取空间信息。通过sigmoid函数得到二维空间注意图FS∈RH ×W。使用 3 × 3 卷积的原因是因为它可以在保持感受野的同时减少计算量。

图片

在通道注意力分支中,使用全局平均池化来聚合每个通道中的特征图。此外,设计了一个多层感知(MLP),它由两个全连接层和一个 ReLU 层组成,以计算每个通道特征的重要性权重。最后,1-D 的注意力图是通过 sigmoid 函数生成的。在参数设置过程中,第一个 FC 层设置为 FC ∈ RC/r×1×1,缩减率值为 16。

图片

03 多尺度感受野

众所周知,CNN 的感受野表示特征图上像素映射到原始图像的区域大小。感受野越大,特征图中的全局信息越多。感受野越小,特征图中更详细的信息就越小。感受野也是影响检测性能的因素之一。

图片

MRF旨在通过设置不同大小的并行卷积来捕获更多的多尺度特征。MRF由四个分支组成,分别使用1×1 Conv、3×3 Conv、5×5 Conv、7×7 Conv和平均池化来拓宽感受野。同时,使用 1×1 Conv 来压缩通道。此外,将 k × k Conv 分解为 1 × k Conv 和 k × 1 Conv。这样,保持感受野的大小不变,缩短AF-SSD的推理时间。MRF模块可以有效增强AD-SSD的浅层特征,检测小物体。

该方法包含三个MRF模块。更具体地说,将MRF添加到Res3d和Res5c分支中,并将C5层和C6层与MRF连接

注:本文仅用于学术分享,如有侵权,请联系后台作删文处理。

最后:

如果你想要进一步了解更多的相关知识,可以关注下面公众号联系~会不定期发布相关设计内容包括但不限于如下内容:信号处理、通信仿真、算法设计、matlab appdesigner,gui设计、simulink仿真......希望能帮到你!

5a8015ddde1e41418a38e958eb12ecbd.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MatpyMaster

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值