[论文阅读] SqueezeSeg V1

mingshili

已于 2022-12-21 20:20:16 修改

阅读量715

点赞数

分类专栏： 3D 激光点云语义分割论文阅读文章标签：论文阅读点云分割

于 2022-12-21 20:09:46 首次发布

本文链接：https://blog.csdn.net/mingshili/article/details/128401356

版权

论文阅读同时被 3 个专栏收录

11 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

激光点云语义分割

10 篇文章 2 订阅

订阅专栏

SqueezeSeg是一种使用深度学习对3D LiDAR点云进行实时道路对象分割的方法。它通过将点云投影到前视图并利用SqueezeNet进行特征提取，解决了传统方法依赖不稳定聚类算法的问题。网络结构包括FireModule和CRF模块，后者用于校准分割结果。实验表明，SqueezeSeg在性能和速度上优于传统方法，并且可以通过模拟数据增强提高泛化能力。

摘要由CSDN通过智能技术生成

paper 原论文的链接
code: 源代码链接

paper全称：SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud

1. 主要思想

通过什么方式，解决了什么问题

当下问题的分析：

传统方法：过滤地面–>聚类其他点的实例–> 手工提取特征–>进行分类
然而存在弊端：

不能很好的一般化应用
pipline的方式可能导致每个阶段误差累计，从而效果差
许多地面消除方法依赖于RANSAC, GP-INSAC,agglomerative clustering. 这些方法都不稳定。

所以作者提出了本文的算法

基本思想：将3D点云投射到前视图上，然后再利用深度学习分割方法获取点的类别。

2. 具体方法

说明怎么解决的，具体设计是什么, 有什么启发性思考（作者的创新点）

2.1 数据处理方式

1. 映射方式：将点的坐标系表示成球坐标的方式，用垂直角度 $\theta$ 和水平角度 $\Phi$ . 如下图公式：
在这里插入图片描述
效果图：

计算水平角度和垂直角度，垂直方向等于激光线数；水平角度范围90度，根据投射平面宽度等分。
通道数[x,y,z,i,r], 其中r为 $\sqrt(x^2+y^2+z^2)$ 深度信息
v2版本添加了一个mask通道，用来表示该像素中是否含有点。

2. 实际的映射

激光的每个水平线束应该投射为一行，但是实际上每一水平线束实际的垂直角度是不一致的(由于车的抖动导致的)，所以一束水平线束不能被投影到一行里，所以作者实际根据每一个点是那个线束发出的来进行投影的，而不是根据公式计算垂直角度进行投射的，而KITTI数据集的排列是按照线束进行排列的，一个线束的点挨在一起。所以可以很好滴实现这个操作，（而我们的点云录制过程每个点没有线束标记，所以不能很好的投射）

3.利用3D场景构建扩增数据集
作者采用DeepGTAV（用Script Hook V as plugin），构建3D场景下的点云扫描数据。