Pointnet与Pointnet++论文笔记

本文详细介绍了Pointnet和Pointnet++在处理点云数据上的设计理念和方法。Pointnet利用对称函数解决点云无序性,通过MAX Pooling获取全局特征,而Pointnet++通过多尺度点云处理增强了对局部特征的捕捉,提高了场景分割的效果。论文作者引入了Set Abstraction层,结合最远点采样、Ball Query和局部PointNet,解决了Pointnet的局限性。
摘要由CSDN通过智能技术生成

Pointnet与Pointnet++论文笔记

近期由于课题需要,研读了Pointnet系列文章,在此总结个人心得,并结合了部分博客进行阐述,不足之处希望各位批评指正,也欢迎各位同学来进行学习交流。

论文地址:https://arxiv.org/abs/1612.00593(pointnet)
论文地址:https://arxiv.org/abs/1706.02413 (pointnet++)

1. 前言

图像数据在计算机中的表示通常编码了像素点之间的空间关系,与此不同的是,点云数据是由一组无序的点所构成一个集合。因此,在使用图像识别任务的深度学习模型处理点云数据之前,需要对点云数据进行一些处理。目前采用的方式主要有两种:

  • 将点云数据渲染到二维平面
    将点云投射到不同方向的二维图像上,并应用标准的二维CNN来提取特征。将从不同图像中学习到的特征通过视图池化层聚合到一个全局特征,然后利用该全局特征对对象进行分类。虽然基于视图的方法在分类任务中可以获得较高的精度,但该方法应用于点云分割存在难度,即点云很难将每个点分类到特定的类别。比较典型的算法有MV3D和AVOD。
  • 将点云数据转换到voxel grid
    通过分割三维空间,引入空间依赖关系到点云数据中,再使用3D卷积等方式来进行处理。然而,点云是稀疏的,并且使用三维网格来表示点云是很浪费的。此外,考虑到体积数据的高内存和计算成本,三维网格的分辨率通常很低,这可能会导致量化伪影。因此,利用体积方法来处理大规模的点云是有问题的。

不同于以上两种方法对点云数据先预处理再使用的方式,PointNet系列论文提出了直接在点云数据上应用深度学习模型的方法。

2. 初识点云

2.1 3D数据的4种表现形式

3D数据的4种表现形式
三维数据的表述形式一般分为四种:

  • 点云:由N个D维的点组成,当这个D=3的时候一般代表着(x,y,z)的坐标,当然也可以包括一些法向量、强度等别的特征。
  • Mesh:由三角面片和正方形面片组成。
  • 体素:由三维栅格将物体用0和1表征。
  • 多角度的RGB图像或者RGB-D图像
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值