《Learning Selective Self-Mutual Attention for RGB-D》论文阅读笔记

Learning Selective Self-Mutual Attention for RGB-D Saliency Detection–RGB-D

显著性检测的学习选择性自相互注意,来自CVPR2020。

1 Motivation

  1. 相比于传统的RGB显著性检测方法,包含深度信息的RGB-D检测可以更好地识别出图像的阳性区域。

  2. 以往的RGB-D检测使用的融合策略(如早期融合、结果融合)作用有限。

2 Contribution

  1. 基于Non-Local,提出一种新的中间融合策略,通过融合深度注意,准确定位出对象的主体。

  2. 将注意力机制应用于双流CNN模型,并引入新的残差融合模块,提高了显著性检测的性能,优于所有现存方法。

3 Approach

本文使用的注意力模型基于Non Local,是在此基础上进行的改进。整个模型框架如下图右侧图像所示:

1如上图所示,不包含深度信息的RGB方法的检测结果含有很严重的假阳性高亮区域。

3.1 Non Local模块

​ 首先简要介绍一种non local模块,如上图左侧部分所示,Non Local模型首先将输入的feature map X \boldsymbol{X} X用三个不同权值的1×1卷积层嵌入到三个通道数均为 C 1 C_1 C1的特征空间中。

​ 之后,计算经过 W θ W_{\theta} Wθ W ϕ W_{\phi} Wϕ嵌入之后的 X \boldsymbol{X} X两个不同视图每个像素点之间的相关性。此处的计算方法是简单的矩阵乘法:
f ( X ) = θ ( X ) ϕ ( X ) ⊤ f(\boldsymbol{X})=\theta(\boldsymbol{X}) \phi(\boldsymbol{X})^{\top} f(X)=θ(X)ϕ(X)
​ 然后,使用softmax对 f ( X ) f(\boldsymbol{X}) f(X)进行行归一化处理得到 X \boldsymbol{X} X的注意力矩阵,第 i i i一行即表示像素点 i i i与其他点之间的注意力权重情况。
A ( X ) = s o f t m a x ( f ( X ) ) A(\boldsymbol{X})=softmax(f(\boldsymbol{X})) A(X)=softmax(f(X))
​ 再将得到的注意力矩阵与 X \boldsymbol{X} X的另一个嵌入视图 g ( X )

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spatial-Channel Attention是一种综合了空间注意力和通道注意力注意力机制,它可以同时考虑输入特征图中的空间信息和特征通道之间的关系,可以更准确地捕捉目标任务相关的特征,提高模型的性能。以下是几种常见的Spatial-Channel Attention机制: 1. CBAM(Convolutional Block Attention Module):CBAM是一种基于卷积块的Spatial-Channel Attention机制,它由两个注意力模块组成:通道注意力模块和空间注意力模块。通道注意力模块通过计算不同通道之间的相似度,确定每个通道的注意力权重;空间注意力模块通过计算不同像素之间的相似度,确定每个像素的注意力权重。CBAM可以在保证模型计算复杂度不增加的情况下,提高模型的性能。 2. BAM(Bottleneck Attention Module):BAM是一种基于瓶颈结构的Spatial-Channel Attention机制,它通过瓶颈结构将输入特征图分解为通道特征图和空间特征图,然后分别计算它们的注意力权重,最后将通道和空间注意力权重相乘得到最终的注意力权重。BAM可以在保持较小的计算量的同时,提高模型的性能。 3. SKNet(Selective Kernel Networks):SKNet是一种基于选择性卷积的Spatial-Channel Attention机制,它通过选择不同的卷积核,计算不同的空间特征图,并使用通道注意力模块计算每个空间特征图的注意力权重,最终将不同空间特征图的加权和作为输出特征图。SKNet可以提高模型的表达能力和鲁棒性。 以上是几种常见的Spatial-Channel Attention机制,它们在计算注意力权重的方式、注意力权重的应用方面都有所不同,可以根据任务需求选择合适的注意力机制。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值