FuNNet-基于多尺度RGB-T融合的多模态神经网络语义分割

最新推荐文章于 2024-06-21 09:37:01 发布

迷途老书虫

最新推荐文章于 2024-06-21 09:37:01 发布

阅读量1.3k

点赞数

分类专栏： RGBT 文章标签：神经网络深度学习计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011490237/article/details/127108508

版权

RGBT 专栏收录该内容

5 篇文章 2 订阅

订阅专栏

Overview

Title：Multi-modal neural networks with multi-scale RGB-T fusion for semantic segmentation 基于多尺度RBG-T融合的多模态神经网络语义分割

Time：2020

Journal：Electronics Letters

Majors：semantic segmentation

Link：

Summary

提出了一种新颖的基于深度学习的frgb和热图像语义分割方，用于基于多分辨率补丁处理的多模态融合。
引入了一种新颖的解码器模块来融合由单独的编码器流提取的RGB和热特征。
在合成数据和实际数据上的实验结果证明了与最新方法相比，该方法的效率。

Contributions

(1) 一种新颖的多模态融合神经网络设计，用于执行RGB-热城市场景的语义图像分割；
(2) 一种新颖的解码器块结构，可有效融合颜色和热特征；
(3)一种高效且鲁棒的方法，具有平衡的复杂性性能比；
(4) 对真实世界和合成数据进行详细的实验验证。

Method

FuNNet-34 是基于以下基本方法设计的：
- (i) 两个编码器 - 一个解码器（2E1D）范式；
- (ii) 多分辨率补丁处理概念；
- (iii) Resdiv 模块设计的残差学习和 ResNeXt 概念。

Model

在这里插入图片描述

FuNNet-34 遵循Encoder-Decoder 范式，由:
- (i) 一个编码器流组成，用于处理大小为 WH3 的输入 RGB 图像，称为 RGB Encoder；
- (ii) 用于处理大小为 W*H 的输入热图像的编码器流，称为热编码器；
- (iii) 一个解码器流，用于融合提取的具有多种分辨率的多模态特征，并计算相应的尺寸为 W*H 的语义分割。
- 其中，每个编码器流包含ResNet-34架构的卷积部分和一个Atrous Spatial Pyramid Pooling (ASPP)模块，旨在处理多尺度的对象分割问题。

在这里插入图片描述

解码器流包含：
- (i) 四个级联层；
- (ii) 基于称作Resdiv的新型解码器块结构设计的五个模块；
- (iii) 执行像素分类的Softmax层。将每个编码器提取的aspp特征图进行级联，然后由Resdiv 5进行处理，将RGB编码器提取的conv2 x、conv3 x和conv4 x特征图与热编码器提取的相应特征图进行级联，然后添加到处理较低分辨率的特征图后获得的相应特征图，最后，它们由相应的Resdiv模块进一步处理。Resdiv 1计算尺寸为WHnc的最终特征图，其中nc是softmax层用于计算输出图像分割的类数。

Experiments

dataset:MF dataset\Cityscapes dataset(synthetic dataset)
在这里插入图片描述

Conclusions

FuNNet-34 是基于多分辨率处理设计的，具有两个编码器和一个解码器流。引入了一种新颖的解码器模块 Resdiv 来融合提取的多模态特征。实验表明，所提出的方法使用微调和不太复杂的架构设计优于所有基于深度学习的最先进的方法。

Evaluation

平均准确度 (mAcc)
平均交并比 (mIoU) 指标

Notes

References

迷途老书虫

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
FuNNet-基于多尺度RGB-T融合的多模态神经网络语义分割

FuNNet-34
复制链接

扫一扫

专栏目录

迷途老书虫

CSDN认证博客专家 CSDN认证企业博客

码龄11年

14: 原创

13万+: 周排名

52万+: 总排名

4万+: 访问

: 等级

199: 积分

26: 粉丝

48: 获赞

6: 评论

476: 收藏

私信

关注

分类专栏

多模态 2篇
RGBT 5篇
mess
study 2篇

最新评论

多模态梳理
卿云阁: 您好，可以加您联系方式问一些关于多模态的问题吗？
多模态梳理
程辛笠2号机: 博主，你好想问一次强化学习能和这个结合吗
多模态梳理
m0_59781092: 你好，请问对于文中提到的后端结合（决策融合），我想要融合视觉、嗅觉、听觉三各模态各自的评分结果，最后输出融合三者后的综合评分，利用决策融合去实现可以吗？
多模态梳理
m0_59781092: 请问博主，我要实现音频、图像、传感器的融合，有相关学习论文推荐吗？
gtsam因子图工具箱的安装
CSDN-Ada助手: 非常感谢博主分享如此有价值的文章，gtsam因子图工具箱的安装对于很多人来说可能非常困难，但在博主的引导下，我相信很多人都能成功安装并使用这个工具箱。下一篇可能创作的博客标题：如何在gtsam因子图工具箱中使用SLAM算法？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。