Asymmetric Two-Stream Architecture for Accurate RGB-D Saliency Detection学习笔记

该博客探讨了在复杂场景中RGB图像特征的局限性,提出了一种不对称双流架构,通过Flow Ladder Module (FLM)、DepthNet和Depth Attention Module (DAM)来保留局部细节和提取全局信息。DepthNet利用深度图获取空间细节,RGBnet结合VGG19和FEM捕捉结构信息。DAM利用深度线索生成注意力权重,精确定位显著目标。
摘要由CSDN通过智能技术生成

一、背景

**
1.对某些复杂情况的RGB图像特征难以鉴别。

appearance features in RGB data are less predictive to some challenging scenes

2.由于RGB图像的复杂特征使用对称两步流模型会“overlooked”,从而产生大量损失。

a symmetric two-stream network may overlook the inherent differences of RGB and depth data.

existing RGB-D methods inevitably suffer from detail information loss [41,16] for adopting strides and pooling operations in the RGB and depth streams.

3.现有的解决方案限制预测特征结构和细节。

An intuitive solution is to use skip-connections [22] or short-connections [21] for reconstructing the detail information.Although these strategies have brought satisfactory improvements, they remain restrictive to predict the complete structures with fine details.

**

二.本文要解决的问题

1.有效提取全局信息并且保留局部细节。
2.使用深度特征引导RGB特征精准定位显

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值