- 在3D shape的分类、检索、分割等应用中,使用神经网络面临的一大挑战是3D shape的不规则性。
- 已有的应有:
- 使用3D object在多个特定角度下的投影,作为输入,使用神经网络进行处理
- 使用voxel-based 的方法,每一个三维cube都使用binary 表示是否为3D object的一部分,这样就解决了 irregularity的问题。
- 使用geometry image的方法,将3D object 参数化到二维平面,GI作为网络输入即可。
- 本文中,同样使用八叉树这种数据结构,来构建神经网络中不同layer之间的联系。
- 具体而言,将3D object存储在八叉树中后,各个不同的3D object对应的叶节点并不相同,在本文实现中,将空叶节点上的法向量等property置为0, 以此保证输入结构的统一性。
- 此外使用Label 数组来记录不同layer 间父子节点对应的关系。在进行convolution、pooling等操作时,将前一层的结果 对应于 后一层的输入,同时,其对应关系与 octree 相对应。所以,步长stride的大小、pooling的kernel大小等应当为2的幂,因为,对应于octree的各层关系。
- 二维下:
————
Octree-based convolutional neural network summary
最新推荐文章于 2024-06-20 09:42:08 发布