前言

MeshCNN是2019年提出的直接在3D Mesh上进行分类和分割的网络,MeshCNN在3D网格上定义了定义了卷积和池化层,依据三维模型边的连通关系进行研究。最终能够在来自SHREC 11数据集的30个类上达到98.6%的精度,并且在部件和人体数据集上有很好的分割性能。

一、网络结构

其网络结构大体如下所示,其结构采用编码器(Encoder)-解码器(Decoder)形式,输入的是每条边的几何特征,论文中是5维,输出是每条边的类别信息,注意这里面的Conv、Pooling、UnPooling操作是在Mesh上进行的,具体细节见后续分析。

深度学习3D Mesh分割网络---MeshCNN_深度学习


实现上可以参考:network.py

深度学习3D Mesh分割网络---MeshCNN_语言模型_02

二、关键点
2.1 输入特征

考虑每条边相邻的两个面,也就是考虑该边的一邻域,共提取以下5个几何特征,这些几何特征不会随着模型的旋转平移而改变。

深度学习3D Mesh分割网络---MeshCNN_网络_03

  • 两个面组成的二面角 * 1
  • 两个面和该边分别对应的内角 * 2
  • 该边边长与相邻面垂线(图中虚线)长度的比率 * 2
2.2 边卷积

考虑边的一邻域,如下图所示,对于当前边e,按逆时针方向考虑其相邻边的特征 a,b,c,d。

深度学习3D Mesh分割网络---MeshCNN_深度学习_04


定义边的卷积为:

深度学习3D Mesh分割网络---MeshCNN_网络_05


即取当前边以及相邻边的特征加权和,ej表示第j条相邻边的特征。

存在问题
按照先前提到的逆时针选取相邻边的顺序,则依赖于先选择哪个面,所以会有(a,b,c,d)和(c,d,a,b)两种情形,这对于同一条边来讲其实是一样的,但是直接进行边卷积顺序不同则会产生不同点值。

解决方法

为了消除顺序不同带来的影响,对四条相邻边的特征进行了如下变换。

深度学习3D Mesh分割网络---MeshCNN_深度学习_06

具体实现

这里自定义的边卷积和普通卷积不一样,所以在实现上进行了处理,即把边特征创建成虚拟的图,在采用卷积核为(1, 5)普通卷积,这里的图的大小为Batch x Channels x Edges x 5,Batch指批处理大小,Channels指特征的维度,Edges表示边的个数,5表示一领域4条边以及本身,代码可以参考create_GeMM函数。

深度学习3D Mesh分割网络---MeshCNN_网络_07

2.3 边池化

边的池化操作包括Pooling和UnPooling两个操作

深度学习3D Mesh分割网络---MeshCNN_语言模型_08

  • Pooling
  • 深度学习3D Mesh分割网络---MeshCNN_ai_09

  • 如上图所示边的池化操作有点类似于边塌缩的减面算法(采用QEM方法,可参考参考链接中给出的参考文献),这里操作比较简单,直接对邻面边进行求平均即:
  • 深度学习3D Mesh分割网络---MeshCNN_ai_10

  • UnPooling
    UnPooling与Pooling操作相反,需要恢复出两个面,先计算出边长,再指定两个面的其他边。
  • 深度学习3D Mesh分割网络---MeshCNN_深度学习_11

细节点

Q: 那池化过程中具体如何确定哪一条边进行坍缩呢?

A: 具体坍缩哪一条边由网络自动进行学习,会依据任务的不同选择保留不同的边(如下图所示)

深度学习3D Mesh分割网络---MeshCNN_网络_12

在具体实现上,简单的按照特征的平方和大小进行排序,直到达到指定的边数为止,代码可以参考mesh_pooling.py

深度学习3D Mesh分割网络---MeshCNN_深度学习_13

三、实现效果

MeshCNN在分类和分割上都取得了较好的效果

  • 分类
  • 深度学习3D Mesh分割网络---MeshCNN_网络_14

  • 分割
  • 深度学习3D Mesh分割网络---MeshCNN_3d_15


  • 深度学习3D Mesh分割网络---MeshCNN_语言模型_16

四、数据处理
4.1 处理步骤

参考: https://github.com/ranahanocka/MeshCNN/wiki/Data-Processing 主要分为以下三步

如果输入是其他格式模型,可以借助 Meshlab对其进行格式转换

meshlabserver -i /path/to/model.off -o /path/to/model.obj
  • 1.
  • 模型简化
    由于有些模型面片数量相差较大,所以先将其简化成相同面片数的Mesh,会更加便于训练。
    减面可以参考: blender_process.py
/opt/blender/blender --background --python blender_process.py /path/to/input_mesh.obj num_faces /path/to/outputmesh.obj
  • 1.
  • 非流形输入数据
    MeshCNN支持流形网格(简单可以理解成一条边对于两个面),对于有些非流形数据,额可以借助 Manifold进行处理。
  • 数据集
    经过处理后得到的数据集如下所示
  • 深度学习3D Mesh分割网络---MeshCNN_语言模型_18

  • seg: 保存每条边的类别信息
    sseg: 保存每条边及邻边得到的类别信息(概率值)
    train: 保存训练的obj模型
    val: 保存验证的obj模型
4.2 数据流

深度学习3D Mesh分割网络---MeshCNN_深度学习_19

中间主要有以下方法

  • fill_mesh()
    给mesh赋值 包括vs,edges,gemm_edges,features等
  • get_mesh_path()
    获取对应obj文件对应的npz文件
    存在obj对应的npz文件则直接解析
    不存在则执行from_scratch()
  • from_scratch()
  • fill_from_file()
    解析obj文件获取vs,faces
  • remove_non_manifolds()
    移除非正常的faces
  • augmentation()
    数据增强
  • build_gemm()
    获取相邻边
  • extract_feature()
    提取特征