一、激光雷达小知识
二、PointNet家族
PointNet家族简介(一)
PointNet解读
【3D视觉】PointNet和PointNet++
1.通过计算发射和接受的时间差,就可以知道反射点距离摄像头的位置。
2.点云通常有如下特征:
(1)稀疏性:点云数据仅存在于物体表面。
(2)数据缺失:由于遮挡导致部分表面未被扫描到。可通过多角度扫描后进行对齐来缓解。
(3)数据噪声:仪器本身的精度或者环境因素导致。
(4)非均匀性:由仪器的采样策略、相对位置、扫描范围等因素引起。
3.网络直接从点云数据中学习特征至关重要,因为转换表示会造成不必要的信息损失,某些其他表示也会不利于网络学习。
4.在点云数据中,每个点除了带有坐标 (x,y,z) 以外,通常也可以有其它数据,例如法向量、颜色等等。
PointNet
这篇文章是点云神经网络的鼻祖,它提出了一种网络结构,可以直接从点云中学习特征。
如何设计出符合点云特点的网络是一个难点。该文章在分类、语义分割两种任务上做出了对比,并给了理论和实验分析。
点云的特点其实非常好理解:
(1)排列不变性:重排一遍所有点的输入顺序,所表示的还是同一个点云数据,网络的输出应该相同。
(2)点集之间的交互性:点与点之间有未知的关联性。
(3)变换不变性:对于某些变换,例如仿射变换,应用在点云上时,不应该改变网络对点云的理解。
仿射变换:由一个非奇异的线性变换(运用一次函数进行的变换)接上一个平移变换组成。
PointNet 是这么处理这三个问题的:
1.排列不变性: 该文章使用了对称函数(Symmetry Function),它的特点是对输入集合的顺序不敏感。这种函数非常多,如 maxpooling,加法,向量点积等。PointNet 采用的是 maxpooling 方法来聚合点集信息。
2.交互性:实际上,对称函数的聚合操作就已经得到了全局的信息,此时将点的特征向量与全局的特征向量 concat 起来,就可以让每个点感知到全局的语义信息了,即所谓的交互性。
3.变换不变性:只需要对输入做一个标准化操作即可。PointNet 使用网络训练出了 D 维空间的变换矩阵。
什么是maxpooling ?
Max Pooling只保留一个最大值,所以即使某个特征出现多次,现在也只能看到一次,就是说同一特征的强度信息丢失了。