FuNNet：基于多尺度RGB-T融合的多模态神经网络语义分割

3D感知巨头

于 2021-04-20 16:56:36 发布

阅读量1.7k

点赞数

分类专栏：语义分割文章标签：深度学习计算机视觉自动驾驶多模态数据融合 RGB-T融合

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013531940/article/details/115741038

版权

语义分割专栏收录该内容

8 篇文章

订阅专栏

目录

三、Background

五、Experiments

论文阅读时间：2021-4-20 16:53:45

一、Title

Multi-modal neural networks with multi-scale RGB-T fusion for semantic segmentation

二、Journal

Electronics Letters

三、Background

在夜间条件下和路灯照明有限的情况下，最先进的算法在处理可见光谱的彩色图像时会失败。在这种情况下，热成像相机可以用来捕捉场景，因为它可以透过黑暗或烟雾“看到”。热像仪感测红外光谱中场景的辐射，并使用记录的辐射使用普朗克方程计算图像辐射源的温度。因此，热成像能够分割在不令人满意的照明下捕获的热辐射图像。（直接知云翻译的论文，Background其实没必要看了）

四、Model

多模态融合神经网络FuNNet-34用于处理对齐后的RGB和热图像，并生成相应的语义图像分割。FuNNet-34是编码器-解码器结构，W×H×3的RGB编码器，W×H的热编码器，解码器用于融合所提取的具有多个分辨率的多模态特征，并计算出语义分割的mask。

每个编码器流包含ResNet-34的卷积部分和ASPP模块，用于处理多尺度的对象分割问题。

解码器流包含:(I)四个级联层；(ii)基于一种新颖的解码器块结构设计的五个模块，称为Resdiv；和(iii)执行像素分类的Softmax层。由每个编码器提取的aspp特征映射被连接，然后由Resdiv 5处理。由RGB编码器提取的conv2 x、conv3 x和conv4 x特征图与由热编码器提取的相应特征图级联，然后添加到在处理较低分辨率特征图后获得的相应特征图中，最后由相应的Resdiv模块进一步处理。Resdiv 1计算大小为W × H × nc的最终特征图，其中nc是softmax层用于计算输出图像分割的类别数。

五、Experiments

Experiment 1

Experiment 2

Experiment 3

Experiment 4

论文阅读时间：2021-4-20 16:53:45

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

3D感知巨头 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。