[论文解读+复现] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

最新推荐文章于 2025-04-08 23:53:55 发布

负壹

最新推荐文章于 2025-04-08 23:53:55 发布

阅读量7.9k

点赞数 9

分类专栏：点云论文阅读笔记 pytorch 文章标签： PCL 点云深度学习 Segmentation pytorch

本文链接：https://blog.csdn.net/qq_41685265/article/details/107283443

版权

pytorch 同时被 2 个专栏收录

19 篇文章

订阅专栏

点云论文阅读笔记

3 篇文章

订阅专栏

一、摘要

本文提出了一种结构简单的物体检测与点云分割、语义分析的深度学习网络，网络具有置换不变性，文章最后对网络的鲁棒性做出了解释。

二、介绍

典型卷积网络需要规则的输入，例如像素和体素，目的是可以共享权重参数（weight），一些研究学者会将点云转化为体素或者图像集再传入神经网络，这会导致数据量变得巨大并造成模糊；为此本文使用简单的统一的结构—点云来进行训练，网络名为：PointNet，但是点云也只是一些点的集合，因此需要满足一些对称性与刚体运动不变性。PointNet可以直接将点云作为输入输出，网络对所有点云统一且独立的做预处理，最开始只传入三坐标，额外的信息可以通过计算法线或者其他本地或全局特征添加。

PointNet关键是对称变换最大池化层的运用，而且在PointNet处理之前还通过仿射变换来标准化点云来提高处理效果，此外本文还从理论和经验两方面对网络做出了评估，评估表明PointNet可以逼近任何一个连续函数，并且可以根据稀疏点去概括一个点云输入；在多个基准数据集上，PointNet与当前最好的方法相比，速度更快、精度更好、鲁棒性更强，具体工作总结如下：

设计了一个新型深度学习结构可以处理无序点云集
展示网络如何用于三维形状分类、形状分割、场景语义分割
从理论和经验上最方法鲁棒性做出评估
图示网络计算过程

三、相关工作

（这一部分就不多说了，一二十篇文章的引用）

四、问题陈述

本文如无特殊说明，点云中的点只用三坐标，不使用其他信息例如颜色、法矢，对于识别任务，输入为直接采集到的点云数据，输出k个分数代表k个类别；对于语义分割，输入可以是用于部分区域分割的单个对象，也可以是3D场景中的子个体，模型将输出n×m个分数，代表n个点分别属于m个类（类似概率）。

五、点云的深度学习

1.点云属性

输入点云是欧式空间中的，具有：无序性、点之间具有相互作用（只是说点与点之间都不是简单独立的）、刚体变换不变性

2.PointNet结构

在分类网络中，输入n个点，对输入做特征变换，再进行最大池化输出k个种类；分割网络是分类网络的一个拓展，它考虑了全局和局部的特征以及每个点的输出分数。mlp代表多层感知机，括号中是感知机的层数，批标准化（Batchnorm）本用于所有带有ReLU函数的层，Dropout层被用于分类网络中最后一个多层感知机中。网络的特点有：