[2021]Cross-modality Discrepant Interaction Network for RGB-D Salient Object Detection

小羊咩~

已于 2022-05-06 15:37:16 修改

阅读量1.2k

点赞数 1

分类专栏： RGB-D 文章标签：深度学习神经网络计算机视觉

于 2022-04-19 10:36:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58702532/article/details/124247548

版权

目录

二、相关工作

三、跨模态差异交互网络（CDINet）

3.1. RGB 诱导的细节增强(RDE) 模块：

3.2. 深度诱导语义增强（DSE）模块：

3.3. 密集解码重建（DDR）模块：

一、动机

低级 RGB 特征可以帮助深度特征区分同一深度级别的不同对象实例，而高级深度特征可以进一步丰富 RGB 语义并抑制背景干扰。为了充分发挥每种模态的优势，同时利用另一种模态来弥补自身，避免造成干扰。

解决特征编码器中的跨模态交互问题

提出了一种跨模态差异交互网络，根据不同层的特征表示，在编码器阶段对两种模态的依赖性进行差异建模，有选择地利用RGB特征补充深度分支的细节，并将深度特征转移到RGB模态中，以丰富语义表示。

（两种模式各有长处，根据它们的作用设计一种差异化的 RGB-D SOD 交互模式，以充分利用两者的优势）

二、相关工作

1. 注意力机制

空间注意力机制[38]：使网络关注感兴趣的区域。

通道注意机制 [20] ：学习每个通道的重要性。

在 RDE 和 DSE 模块中采用了空间方面和通道方面的注意。此外，我们更关注注意力的跨模态应用，即利用一种模态生成的注意力图来增强另一种模态特征，从而以注意力的形式实现更有效的跨模态引导。

2. 跳过连接

Long-range skip connection是像素级预测任务中恢复图像细节的一种措施，几乎所有的RGB-D SOD模型都配备了它。对于在编码器中发生跨模态交互的模型，跳过连接表示为直接的特征加法或连接， 对于在解码器中融合跨模态特征的其他网络，专有模块通常被设计为包含跳过特征（也称为边输出）。

三、跨模态差异交互网络（CDINet）

该网络由三部分组成：（1）RDE（2）DSE（3）DDR

该网络遵循编码器-解码器架构：包括两个编码器（RGB 和深度模态）和一个解码器，两个编码器均采用 VGG16网络，丢弃最后的池化层和全连接层，作为主干提取相应的多级特征表示，实现跨模态信息交互。从主干提取的RGB特征（），深度特征（）（其中𝑟和𝑑代表RGB和深度分支，𝑖∈{1,2,...,5}索引feature level）

（1）RDE低级特征编码阶段

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。