PointNet学习笔记(一)—— 论文
本文记录了博主在学习《PointNet: Deep Learning on Point Sets for 3D Clasification and Segmentation》过程中的总结笔记。更新于2019.4.9。
文章目录
Introduction
网络输入:点云输据(point clouds);
网络输出:将输入视作一个整体的标签,或输入内每个分割部分(segment/part)的标签。
每个点的基本描述是其坐标 ( x , y , z ) ( x , y , z ) ( x , y , z ) (x,y,z)(x,y,z) (x,y,z) (x,y,z)(x,y,z)(x,y,z)γ。关于Theorem的证明可以在支撑材料中找到。
这个理论显示,在最坏的情况下,网络也会将空间等分成voxel以描述输入。然而,实验显示,网络的学习结果要比这个好很多。
2. Bottleneck dimension and stability.
实验和理论标明,PointNet的表现严重受到max pooling层维度的影响(也就是公式(1)中的 K K K