点云 3D 分割 - SqueezeSegV1、SqueezeSegV2、SqueezeSegV3

1. SqueezeSegV1 简介

1.1 文章信息

(1)标题:SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud (ICRA 2018)

(2)文章链接:https://arxiv.org/pdf/1710.07368.pdf

(3)文章代码:https://github.com/BichenWuUCB/SqueezeSeg

(4)文章解析:点云 3D 分割 - SqueezeSeg(ICRA 2018)

1.2 算法特点

速度快

1.3 算法摘要

在本文中,我们讨论了从 3D LiDAR 点云中对道路对象进行语义分割的问题。特别是,我们希望检测和分类感兴趣的实例,例如汽车、行人和骑自行车的人。我们将该问题描述为一个逐点分类问题,并提出了一种基于卷积神经网络(CNN)的端到端管道称为 SqueezeSeg:CNN 将转换后的 LiDAR 点云作为输入,直接输出逐点标签匹配,然后通过一个条件随机场(CRF)进行细化,该随机场作为一个循环层来实现。然后通过传统的聚类算法获得实例级标签。我们的 CNN 模型是在 KITTI 数据集中的 LiDAR 点云上训练的,我们的逐点分割标签来自 KITTI 的 3D 边界框。为了获得额外的训练数据,我们在流行的视频游戏《侠盗猎车手V》(GTA-V)中构建了一个 LiDAR 模拟器,以合成大量真实的训练数据。我们的实验表明,SqueezeSeg 以惊人的速度和稳定的运行时间(每帧8.7±0.5毫秒)实现了高精度,非常适合自动驾驶应用。此外,对合成数据的额外培训可以提高对真实数据的验证准确性。我们的源代码和合成数据将是开源的。

在这里插入图片描述

激光雷达投影。注意,每个通道反映相机视图图像中的结构信息。

在这里插入图片描述

SquezeSeg的网络结构。

1.4 参考资料

参考文章原文和源代码,走读一遍,大概就清楚了,以下参考也可以了解。

参考资料

2. SqueezeSegV2 简介

2.1 文章信息

(1)标题:SqueezeSegV2: Improved Model Structure and Unsupervised Domain Adaptation for Road-Object Segmentation from a LiDAR Point Cloud (ICRA 2019)

(2)文章链接:https://arxiv.org/pdf/1809.08495v1.pdf

(3)文章代码:https://github.com/xuanyuzhou98/SqueezeSegV2

(4)文章解析:点云 3D 分割 - SqueezeSegV2(ICRA 2019)

2.2 算法特点

速度较快、精度较高

2.3 算法摘要

早期的工作证明了基于深度学习的点云分割方法的前景;然而,这些方法需要加以改进,以便实际有用。为此,我们介绍了一种新的模型SqueezeSegV2,该模型对 LiDAR 点云中的衰减噪声更具鲁棒性。凭借改进的模型结构、训练损失、批量标准化和额外的输入通道,SqueezeSegV2 在真实数据上训练时实现了显著的精度提高。用于点云分割的训练模型需要大量标记的点云数据,获取这些数据非常昂贵。为了避免收集和标注的成本,可以使用 GTA-V 等模拟器创建无限量的标记合成数据。然而,由于领域转移,基于合成数据训练的模型往往不能很好地推广到现实世界。我们通过一个域自适应训练管道来解决这个问题,该管道由三个主要部分组成:1) 学习强度渲染,2)测地线相关对齐,3)渐进域校准。当在真实数据上进行训练时,我们的新模型显示分割精度比原来的 SqueezeSeg 提高了6.0-8.6%。当我们使用提出的领域适应管道在合成数据上训练我们的新模型时,我们对真实数据的测试精度几乎翻了一番,从29.0%到57.4%。我们的源代码和合成数据集将是开源的。

在这里插入图片描述

域转移的一个例子。将点云投影到球形表面上进行可视化(红色为汽车,蓝色为行人)。我们的领域自适应流水线改进了从(c)到(d)的分段,同时对合成数据进行了训练。

在这里插入图片描述

用于从3D LiDAR点云分割道路目标的SqueezeSegV2模型的网络结构。

2.4 参考资料

参考文章原文和源代码,走读一遍,大概就清楚了,以下参考也可以了解。

参考资料

3. SqueezeSegV3 简介

3.1 文章信息

(1)标题:Squeezesegv3: Spatially-adaptive convolution for efficient point-cloud segmentation (ECCV 2020)

(2)文章链接:https://arxiv.org/pdf/2004.01803.pdf

(3)文章代码:https://github.com/chenfengxu714/SqueezeSegV3

3.2 算法特点

精度高

3.3 算法摘要

LiDAR 点云分割是许多应用中的一个重要问题。对于大规模点云分割,实际的方法是投影一个3D点云,得到一个2D LiDAR 图像,并使用卷积进行处理。尽管常规 RGB 图像和 LiDAR 图像之间存在相似性,但我们发现,在不同的图像位置,LiDAR 图像的特征分布会发生剧烈变化。使用标准卷积来处理这样的 LiDAR 图像是有问题的,因为卷积滤波器会拾取仅在图像中特定区域中活动的局部特征。因此,网络的能力没有得到充分利用,分割性能下降。为了解决这个问题,我们提出了空间自适应卷积(SAC),根据输入图像的不同位置采用不同的滤波器。SAC 可以高效地计算,因为它可以实现为一系列元素级乘法、im2col 和标准卷积。这是一个总体框架,因此之前的几种方法可以被视为 SAC 的特例。使用 SAC,我们构建了用于 LiDAR 点云分割的 SqueezeSegV3,并在 SemanticKITTI 基准上以相当的推理速度比所有先前发布的方法至少高出 3.7% 的 mIoU。

在这里插入图片描述

SquezeSegV3。投影LiDAR点云以生成LiDAR图像,然后通过空间自适应卷积(SAC)对其进行处理。网络输出逐点预测,该预测可以被恢复以标记3D点云。

  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

77wpa

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值