【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

最新推荐文章于 2024-06-26 09:41:30 发布

数据派THU

最新推荐文章于 2024-06-26 09:41:30 发布

阅读量789

点赞数

文章标签： 3d 自动驾驶机器学习人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247597147&idx=4&sn=c4423a6a66fff56749c3ec718e7f64cf&chksm=e9e075d0de97fcc686556458cd7694f5633205d695f37fc05fca6485812314eb3f73c74dd26b&scene=126&sessionid=0

版权

文章介绍了一种名为MSeg3D的多模态3D语义分割模型，该模型结合激光雷达和相机数据，解决模态异质性、有限传感器视场交叉点和多模态数据增强的挑战。通过几何、跨模态和语义特征融合，MSeg3D在nuScenes、Waymo和SemanticKITTI数据集上取得最佳性能，并在输入异常情况下保持鲁棒性。

摘要由CSDN通过智能技术生成

来源：专知
本文为论文，建议阅读5分钟
本文提出一种联合模态内特征提取和模态间特征融合的多模态3D语义分割模型(MSeg3D)。

激光雷达和相机是自动驾驶中可用于3D语义分割的两种模态。由于激光点不足，流行的仅用激光雷达的方法在小而远的目标上存在严重的分割问题，而鲁棒的多模态解决方案尚未得到充分探索，本文研究了三个关键的内在困难:模态异质性、有限的传感器视场交叉点和多模态数据增强。为此，提出一种联合模态内特征提取和模态间特征融合的多模态3D语义分割模型(MSeg3D)。MSeg3D中的多模态融合包括所有可见点上基于几何的特征融合GF-Phase、跨模态的特征补全和基于语义的特征融合SF-Phase。通过对LiDAR点云和多相机图像分别应用非对称变换来重新激活多模态数据增强，这有利于通过多样化的增强变换进行模型训练。MSeg3D在nuScenes, Waymo和SemanticKITTI数据集上取得了最先进的结果。在故障多摄像机输入和多帧点云输入下，MSeg3D仍然表现出鲁棒性，并改善了LiDARonly基线。我们的代码通过https: //github.com/jialeli1/lidarseg3d公开。

数据派THU

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
【CVPR2023】MSeg3D:面向自动驾驶的多模态3D语义分割

来源：专知本文为论文，建议阅读5分钟本文提出一种联合模态内特征提取和模态间特征融合的多模态3D语义分割模型(MSeg3D)。激光雷达和相机是自动驾驶中可用于3D语义分割的两种模态。由于激光点不足，流行的仅用激光雷达的方法在小而远的目标上存在严重的分割问题，而鲁棒的多模态解决方案尚未得到充分探索，本文研究了三个关键的内在困难:模态异质性、有限的传感器视场交叉点和多模态数据增强。为此，提出一种联合...
复制链接

扫一扫