RGBD模态融合问题

当图像特征中RGB图像和depth图像特征有鸿沟时,怎么进行融合呢?这里从RGBD SOD显著性检测的领域找了一些最新论文的方法,并附上代码,以供参考。

1、2022 Multi-modal interactive attention and dual progressive decoding network for RGB-D/T salient object detection

GitHub - Liangyh18/MIA_DPD

multi-modal interactive attention (MIA) 多模态交互注意力单元:
学习每个单模式的重要性

joint attention guided cross-modal decoding (JAGCD) module联合注意引导的跨模态解码模块:
捕捉这三种模态的多尺度融合特征,上采样和注意机制对三流信息进行初步整合。
通道注意(CA)、空间注意(SA)结合:用简单和轻量级的微调CBAM,高层指导低层进行融合和decoder。
MFPD:对多尺度跨模态信息的进一步融合
二、 2021  Calibrated RGB-D Salient Object Detection
https://github.com/jiwei0921/DCF
交叉参考模块(CRM)来融合来自RGB和校准depth流的特征表示。

 三、2021 CDNet: Complementary Depth Network for RGB-D Salient Object Detection

GitHub - blanclist/CDNet

两阶段融合: 高级低级的depth特征分别用于预测初始显著性映射和细粒度的显著性边界。
Feature Aggregation Module (FAM)特征聚合模块
四、2021 Hierarchical Alternate Interaction Network for RGB-D Salient Object Detection

https://github.com/MathLee/HAINet

分层交替交互网络(HAINet):三个阶段:特征编码、跨模态交替交互和显著性推理。层次交替交互模块(HAIM)首先使用RGB特征来过滤depth特征上的干扰物,然后利用纯化后的depth特征来依次增强RGB特征。
(RGB-depth-RGB 流范式)层次结构提供了上下文特征,交替交互单元逐步执行
modulation-feedback mechanism,特征重加权来保存最有价值的信息。

 

五、21 RGB-D Salient Object Detection via 3D Convolutional Neural

3D CNN聚合广泛信息的能力。将depth模态作为RGB的另一个“时间状态“,通过3D CNN聚合两种模态的信息,使得在解码器阶段显式融合,且不需要再设计复杂的跨模态融合模块。

六、2015 Siamese Network for RGB-D Salient Object Detection and Beyond

协同融合(加法、乘法)GitHub - kerenfu/JLDCF: Code for CVPR-2020 paper "JL-DCF: Joint Learning and Densely-Cooperative Fusion Framework for RGB-D Salient Object Detection"

“⊕”利用了特征的互补性,而“⊗”更强调特征的共性 。可视为一种residual attention

七、2020 Learning Selective Mutual Attention and Contrast for RGB-D Saliency Detection

选择性互注意与对比(SMAC)模块(融合了两个模态的互注意力机制和对比机制(前后景对比),还用了选择性注意力自适应调整深度图融合所占的权重)

GitHub - nnizhang/SMAC: ReDWeb-S: a large-scale challenging dataset for RGB-D Salient Object Detection.

 八、2020 Is Depth Really Necessary for Salient Object Detection?

信道感知融合模块(CAF),它可以自适应地选择鉴别特征来进行对象理解。

DASNet 2020 (cvteam.net)

九、2020 Feature Reintegration over Differential Treatment: A Top-down and Adaptive Fusion Network for RGB-D Salient Object Detection

提出了两种模块分别针对高层级特征和低层特征的融合

IFM专注于结合来自两种高水平模态的全局信息,而GSFM的目标是通过“在低水平中删除不必要的信息来融合有用的本地信息。

IFM如下图,因为高层特征细节不多,所以不用很复杂:

GSFM(门控选择融合模块)如下图,

 并且每一层特征融合时都引入了监督:

 十、2020 Depth Quality Aware Salient Object Detection

 主要不是特征融合,是怎么得到有贡献的深度特征: 多加一流进行监督学习,学习到深度图中有、但RGB中没有的、对saliency map的贡献。

精髓在于用这样的pGT = {P + B}的损失函数进行监督

十一、2020 Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient Object Detection

将原始的四维RGB-D循环转换为DGB、RDB和RGD。

  • 5
    点赞
  • 50
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值