DeepSD论文笔记

最新推荐文章于 2022-06-06 02:40:12 发布

lzn1251

最新推荐文章于 2022-06-06 02:40:12 发布

阅读量852

点赞数

分类专栏：三维计算机视觉

本文链接：https://blog.csdn.net/lzn025/article/details/114264031

版权

三维计算机视觉专栏收录该内容

5 篇文章

订阅专栏

说明：
1.此乃本人阅读论文过程中所记录的笔记，由于本人水平有限，难免会出现遗漏重点或表述不清等问题，请各位见谅。同时希望各位指出我的问题，让我发现问题所在，谢谢大家Thanks♪(･ω･)ﾉ。
2.有些用词根据原文翻译（或是直接用原文），可能语句不通畅。（毕竟我是一个六级考了五次的憨憨）
3.数据处理部分和结论分析部分没有加入，此处主要为了理清文章描述方法的处理流程。

论文题目：3D Deep Shape Descriptor

1.重要概念介绍
三维特征描述符（3D shape signatures）：用于描述三维曲面上的一个点的局部几何信息。
三维模型描述符（3D shape descriptors）：用于表示三维模型的整体表达。
热核特征描述符（Heat kernel signature）：给定图G=（V,E,W），其中V为顶点的集合，E为边的集合，W为每条边的权重的集合。物体表面的热量由以下热核公式近似：
$H_t(p_{1},p_{2})=\sum_{i=0}^{\infty}(-\lambda_i^{'}t)\phi_i(p_1)\phi_i(p_2)$
其中 $p_1$ 和 $p_2$ 为图上的两个顶点，t为给定的时间， $\lambda_i^{'}$ 和 $\phi_i$ 为由Laplace-Beltrami算子得到的第i个特征值和对应的第i个特征向量。
热核满足以下偏微分方程：
$\frac{\partial H_t}{\partial t}=-LH_t$
其中L表示Laplace-Beltrami算子，t表示热量的扩散时间。
那么点p处的热核描述符由以下公式给出：
$HKS(p)=(H_{t_1}(p,p),H_{t_2}(p,p),...,H_{t_n}(p,p))$
此处根据热量扩散时间进行n次采样。、
热模型描述符（Heat shape descriptor）:在各个规模下所有顶点处的HKS的概率分布。HeatSD具有等距变换不变性。
Eigen模型描述符（Eigen-shape descriptor）：
$S=\frac{1}{n}\sum_{i=1}^n(x_i-\mu)(x_i-\mu)^T$
其中S为训练集的协方差矩阵， $\mu$ 为训练集的均值。求特征值方程：
$Sv_i=\lambda_iv_i,$ i=1,2,…,n
其中 $v_i$ 为第i个Eigen模型描述符。
Fisher模型描述符（Fisher-shape descriptor）:
$S_B=\sum_{i=1}^cN_i(\mu_i-\mu)(\mu_i-\mu)^T$
其中 $S_B$ 是反映不同类之间利润的散点矩阵， $\mu_i$ 为第i类的均值，μ为总均值。
$S_W=\sum_{i=1}^c\sum_{x_j\in X_i}(x_j-\mu_i)(x_j-\mu_i)^T$
其中 $S_W$ 为反映同类中相似度的散点矩阵， $\mu_i$ 为第i类的平均值。
求特征值方程：
$S_Bv_i=\lambda_iS_Wv_i$
其中 $v_i$ 为第i个Fisher模型描述符。

2.解决的问题
将三维模型转换为二维投影图像时，无法用简洁的方式表示三维模型，没有抓住三维模型潜在的几何信息以及一些具有辨识度的信息，如颜色、纹理、外形等。

3.处理方法主要步骤
在这里插入图片描述
上图展示了整个流程的处理顺序，主要分为以下四步：
1）输入三维模型数据库，包含训练集和测试集。
2）对数据库中的每个三维模型提取热核特征描述符（HKS），然后根据热核特征描述符计算得到热模型描述符（HeatSD）。
3）将得到的热模型描述符分别输入两个深度神经网络，利用主成分分析（PCA）得到Eigen特征描述符（ESD），利用线性判别分析（LDA）得到Fisher特征描述符(FSD)。
4）分别用ESD和FSD作为目标值，训练两个编码器，从隐藏层中提取深度模型描述符（Deep Shape Descriptor，DeepSD）。