深度学习3D Mesh分割网络---MeshCNN

Engle SEN

于 2024-08-20 02:54:08 发布

阅读量54

点赞数

文章标签：深度学习 3d 网络人工智能

前言

MeshCNN是2019年提出的直接在3D Mesh上进行分类和分割的网络，MeshCNN在3D网格上定义了定义了卷积和池化层，依据三维模型边的连通关系进行研究。最终能够在来自SHREC 11数据集的30个类上达到98.6%的精度，并且在部件和人体数据集上有很好的分割性能。

一、网络结构

其网络结构大体如下所示，其结构采用编码器(Encoder)-解码器(Decoder)形式，输入的是每条边的几何特征，论文中是5维，输出是每条边的类别信息，注意这里面的Conv、Pooling、UnPooling操作是在Mesh上进行的，具体细节见后续分析。

深度学习3D Mesh分割网络---MeshCNN_深度学习

实现上可以参考：network.py

深度学习3D Mesh分割网络---MeshCNN_语言模型_02

二、关键点

2.1 输入特征

考虑每条边相邻的两个面，也就是考虑该边的一邻域，共提取以下5个几何特征，这些几何特征不会随着模型的旋转平移而改变。

深度学习3D Mesh分割网络---MeshCNN_网络_03

两个面组成的二面角 * 1
两个面和该边分别对应的内角 * 2
该边边长与相邻面垂线（图中虚线）长度的比率 * 2

2.2 边卷积

考虑边的一邻域，如下图所示，对于当前边e，按逆时针方向考虑其相邻边的特征 a,b,c,d。

深度学习3D Mesh分割网络---MeshCNN_深度学习_04

定义边的卷积为：

深度学习3D Mesh分割网络---MeshCNN_网络_05

即取当前边以及相邻边的特征加权和，ej表示第j条相邻边的特征。

存在问题
按照先前提到的逆时针选取相邻边的顺序，则依赖于先选择哪个面，所以会有(a,b,c,d)和(c,d,a,b)两种情形，这对于同一条边来讲其实是一样的，但是直接进行边卷积顺序不同则会产生不同点值。

解决方法

为了消除顺序不同带来的影响，对四条相邻边的特征进行了如下变换。

深度学习3D Mesh分割网络---MeshCNN_深度学习_06

具体实现

这里自定义的边卷积和普通卷积不一样，所以在实现上进行了处理，即把边特征创建成虚拟的图，在采用卷积核为（1， 5）普通卷积，这里的图的大小为Batch x Channels x Edges x 5，Batch指批处理大小，Channels指特征的维度，Edges表示边的个数，5表示一领域4条边以及本身，代码可以参考create_GeMM函数。

深度学习3D Mesh分割网络---MeshCNN_网络_07

2.3 边池化

边的池化操作包括Pooling和UnPooling两个操作

深度学习3D Mesh分割网络---MeshCNN_语言模型_08

Pooling
如上图所示边的池化操作有点类似于边塌缩的减面算法（采用QEM方法，可参考参考链接中给出的参考文献），这里操作比较简单，直接对邻面边进行求平均即：
UnPooling
UnPooling与Pooling操作相反，需要恢复出两个面，先计算出边长，再指定两个面的其他边。

细节点

Q: 那池化过程中具体如何确定哪一条边进行坍缩呢？

A: 具体坍缩哪一条边由网络自动进行学习，会依据任务的不同选择保留不同的边(如下图所示)

深度学习3D Mesh分割网络---MeshCNN_网络_12

在具体实现上，简单的按照特征的平方和大小进行排序，直到达到指定的边数为止，代码可以参考mesh_pooling.py

深度学习3D Mesh分割网络---MeshCNN_深度学习_13

三、实现效果

MeshCNN在分类和分割上都取得了较好的效果

分类
分割

四、数据处理

4.1 处理步骤

参考： https://github.com/ranahanocka/MeshCNN/wiki/Data-Processing 主要分为以下三步

将Mesh模型以obj格式存储
obj格式以点坐标和面来存储Mesh，具体可以参考： https://all3dp.com/1/obj-file-format-3d-printing-cad/

如果输入是其他格式模型，可以借助 Meshlab对其进行格式转换

模型简化
由于有些模型面片数量相差较大，所以先将其简化成相同面片数的Mesh，会更加便于训练。
减面可以参考： blender_process.py

/opt/blender/blender --background --python blender_process.py /path/to/input_mesh.obj num_faces /path/to/outputmesh.obj

非流形输入数据
MeshCNN支持流形网格（简单可以理解成一条边对于两个面），对于有些非流形数据，额可以借助 Manifold进行处理。
数据集
经过处理后得到的数据集如下所示
seg: 保存每条边的类别信息
sseg: 保存每条边及邻边得到的类别信息（概率值）
train：保存训练的obj模型
val: 保存验证的obj模型