目前二维深度学习取得了很大的进步并且应用范围越来越广,随着三维设备的发展,三维深度学习得到了很大的关注。PointNet是斯垣福大学在2016年提出的一种点云分类/分割深度学习框架。
PointNet原文及代码下载:http://stanford.edu/~rqi/pointnet/
点云的概念:点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点的集合。在获取物体表面每个采样点的空间坐标后,得到的点的集合,称之为“点云”(Point Cloud)。
三维数据深度学习和图像的深度学习有什么区别?
最大的区别就是由三维数据本身的复杂性带来,它不像图像可以直接表示成一个二维的矩阵。且三维的数据有很多种不同的表达形式,不同的表达形式可能有不同的应用:
1.多视角(multi-view):通过多视角二维图片组合为三维物体,此方法将传统CNN应用于多张二维视角的图片,特征被view pooling procedure聚合起来形成三维物体;
2.体素(volumetric):通过将物体表现为空间中的体素进行类似于二维的三维卷积(例如,卷积核大小为5x5x5),是规律化的并且易于类比二维的,但同时因为多了一个维度出来,时间和空间复杂度都非常高,目前已经不是主流的方法了;
3.点云(point clouds):直接将三维点云抛入网络进行训练,数据量小。主要任务有分类、