跨尺度特征融合

图片

使用 CNN 从图像中提取特征已成为主流。神经网络的可学习性可用于处理具有复杂背景的遥感图像。随着神经网络层数加深,获取的特征图表示的语义信息也在发生变化。具体来说,浅层特征图包含更多位置信息,有利于定位的实现;而深层特征图包含更多语义信息,有利于分类任务。

图片

具体来说,SE 块是用于建模 CNN 特征通道之间关系的注意力模块。它可以抑制背景噪声,并通过显式建模通道之间的相互依赖关系并自适应地重新校准通道方向的特征响应来突出目标特征。然而,当将SE块完全嵌入到backbone中时,推理时间会在一定程度上增加,所以只是将SE块放在具有更多语义信息的深层,然后通过CSFF模块逐步将增强的全局特征传输到所有其他较浅的层。

CSFF模块主要用于特征融合,每个特征尺度的特征增强。通过使用CSFF模块,合并特征的上下文信息以更好地实现目标的特征提取,以解决类间相似性的问题。采用FPN的输出,即FA2、FA3、FA4、FA5和FA6,作为CSFF模块的输入。其中,深层特征图包含更多的语义信息,浅层特征图具有更好的位置信息。

SE

图片

这里SE块的作用是更多地关注遥感图像目标检测当前任务的有效特征学习。不同深度的SE块通过结合挤压和激励操作来创建具有不同通道特征的全局分布通道响应,并显式地对通道关系进行建模,从而在所有网络中扮演着不同的角色。我们的方法不同于SENet,它将SE块嵌入到ResNet的每个阶段。在我们的工作中,只是将SE块插入到FPN深层的输出中,以突出特征通道之间的高级语义信息。

给定要输入的原始特征X,X∈RH∗W∗C,首先使用FSqueeze操作通过全局平均池(GAP)压缩全局空间信息来获得C维通道。然后,采用FExcitation操作通过自门控方案捕获通道激活(即所有特征通道的激励)。最后,通过使用 FScale 操作将原始特征 X 与学习激活重新缩放来获得 SE 块的输出。参考论文:Squeeze-and-Excitation Networks

图片

CSFF

图片

特征表示在图像目标检测任务中发挥着核心作用。为了适应不同大小的对象,从多个 CNN 尺度中提取特征已成为一种流行的方式。CSFF考虑了跨尺度特征信息,因此,多个特征图的融合更有利于不同尺度目标的检测。

从FPN得到FA2、FA3、FA4和FA5四个尺度的特征图,利用SE块得到F' A6。它们都具有相同的通道维度。首先,需要通过使用  1 × 1 卷积将 FA2、FA3、FA4、FA5 和 F′A6 的通道维度(即特征图的厚度)从 256 减少到 64,得到 FB2、FB3、FB4、FB5 和 FB6 的五个中间特征。对于每个尺度 i ,i = 2, 3, 4, 5, 6,四个 FB 特征期望 F Bi 首先上采样和(或)下采样,然后连接以获得与尺度 i 具有相同空间维度的 256-D 特征图。最后,将FAi的特征图与前面获得的256-D特征图在元素级相加,实现所有五个尺度的跨尺度融合。这样,在后续预测的处理中,不仅使用了当前层的特征信息,还考虑了其他四层的上下文特征,使获得的新特征更加强大。可以发现,FC4是将所有尺度的特征相结合的结果。通过这种方式,深尺度和浅尺度的特征都被用来实现高质量的物体检测。这种方法对于遥感图像中的目标检测任务特别有效,因为它可以解决目标大小变化大以及类间相似性的挑战。

注:本文仅用于学术分享,如有侵权,请联系后台作删文处理。

最后:

如果你想要进一步了解更多的相关知识,可以关注下面公众号联系~会不定期发布相关设计内容包括但不限于如下内容:信号处理、通信仿真、算法设计、matlab appdesigner,gui设计、simulink仿真......希望能帮到你!

5a8015ddde1e41418a38e958eb12ecbd.png

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
卷积神经网络(Convolutional Neural Network,CNN)是一种广泛应用于图像处理和计算机视觉任务的深度学习模型多尺度特征融合是指在卷积网络中,通过融合不同度的特征图来提高模型的性能。 在卷积神经网络中,多尺度特征融合可以通过以下几种方式实现: 1. 并行卷积:在网络的不同分支上使用不同大小的卷积核进行卷积操作,然后将不同分支的特征图进行融合。这种方法可以捕捉到不同尺度下的特征信息。 2. 金字塔池化:通过在不同层级上进行池化操作,得到不同尺度的特征图。然后将这些特征图进行融合,可以提取到更全局和更局部的特征信息。 3. 层连接:在网络的不同层级上进行特征融合,可以通过跳跃连接(skip connection)或者残差连接(residual connection)来实现。这种方式可以使得底层的细节特征和高层的语义特征相结合。 4. 特征金字塔:通过在不同层级上进行特征提取,并将这些特征进行融合,可以得到多尺度的特征金字塔。这种方式可以在不同尺度上进行目标检测和分割等任务。 关于代码实现,以下是一个简单的示例: ```python import torch import torch.nn as nn class MultiScaleFeatureFusion(nn.Module): def __init__(self, in_channels, out_channels): super(MultiScaleFeatureFusion, self).__init__() self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1) self.conv2 = nn.Conv2d(in_channels, out_channels, kernel_size=5, padding=2) self.conv3 = nn.Conv2d(in_channels, out_channels, kernel_size=7, padding=3) def forward(self, x): out1 = self.conv1(x) out2 = self.conv2(x) out3 = self.conv3(x) out = torch.cat([out1, out2, out3], dim=1) return out ``` 以上代码是一个简单的多尺度特征融合模块,输入为`in_channels`通道数的特征图,输出为`out_channels`通道数的特征图。在模块内部,使用了不同大小的卷积核进行卷积操作,并将结果进行拼接。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

MatpyMaster

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值