说明:
1.此乃本人阅读论文过程中所记录的笔记,由于本人水平有限,难免会出现遗漏重点或表述不清等问题,请各位见谅。同时希望各位指出我的问题,让我发现问题所在,谢谢大家Thanks♪(・ω・)ノ。
2.有些用词根据原文翻译(或是直接用原文),可能语句不通畅。(毕竟我是一个六级考了五次的憨憨)
3.数据处理部分和结论分析部分没有加入,此处主要为了理清文章描述方法的处理流程。
论文题目:3D Deep Shape Descriptor
1.重要概念介绍
三维特征描述符(3D shape signatures):用于描述三维曲面上的一个点的局部几何信息。
三维模型描述符(3D shape descriptors):用于表示三维模型的整体表达。
热核特征描述符(Heat kernel signature):给定图G=(V,E,W),其中V为顶点的集合,E为边的集合,W为每条边的权重的集合。物体表面的热量由以下热核公式近似:
H
t
(
p
1
,
p
2
)
=
∑
i
=
0
∞
(
−
λ
i
′
t
)
ϕ
i
(
p
1
)
ϕ
i
(
p
2
)
H_t(p_{1},p_{2})=\sum_{i=0}^{\infty}(-\lambda_i^{'}t)\phi_i(p_1)\phi_i(p_2)
Ht(p1,p2)=∑i=0∞(−λi′t)ϕi(p1)ϕi(p2)
其中
p
1
p_1
p1和
p
2
p_2
p2为图上的两个顶点,t为给定的时间,
λ
i
′
\lambda_i^{'}
λi′和
ϕ
i
\phi_i
ϕi为由Laplace-Beltrami算子得到的第i个特征值和对应的第i个特征向量。
热核满足以下偏微分方程:
∂
H
t
∂
t
=
−
L
H
t
\frac{\partial H_t}{\partial t}=-LH_t
∂t∂Ht=−LHt
其中L表示Laplace-Beltrami算子,t表示热量的扩散时间。
那么点p处的热核描述符由以下公式给出:
H
K
S
(
p
)
=
(
H
t
1
(
p
,
p
)
,
H
t
2
(
p
,
p
)
,
.
.
.
,
H
t
n
(
p
,
p
)
)
HKS(p)=(H_{t_1}(p,p),H_{t_2}(p,p),...,H_{t_n}(p,p))
HKS(p)=(Ht1(p,p),Ht2(p,p),...,Htn(p,p))
此处根据热量扩散时间进行n次采样。、
热模型描述符(Heat shape descriptor):在各个规模下所有顶点处的HKS的概率分布。HeatSD具有等距变换不变性。
Eigen模型描述符(Eigen-shape descriptor):
S
=
1
n
∑
i
=
1
n
(
x
i
−
μ
)
(
x
i
−
μ
)
T
S=\frac{1}{n}\sum_{i=1}^n(x_i-\mu)(x_i-\mu)^T
S=n1∑i=1n(xi−μ)(xi−μ)T
其中S为训练集的协方差矩阵,
μ
\mu
μ为训练集的均值。求特征值方程:
S
v
i
=
λ
i
v
i
,
Sv_i=\lambda_iv_i,
Svi=λivi, i=1,2,…,n
其中
v
i
v_i
vi为第i个Eigen模型描述符。
Fisher模型描述符(Fisher-shape descriptor):
S
B
=
∑
i
=
1
c
N
i
(
μ
i
−
μ
)
(
μ
i
−
μ
)
T
S_B=\sum_{i=1}^cN_i(\mu_i-\mu)(\mu_i-\mu)^T
SB=∑i=1cNi(μi−μ)(μi−μ)T
其中
S
B
S_B
SB是反映不同类之间利润的散点矩阵,
μ
i
\mu_i
μi为第i类的均值,μ为总均值。
S
W
=
∑
i
=
1
c
∑
x
j
∈
X
i
(
x
j
−
μ
i
)
(
x
j
−
μ
i
)
T
S_W=\sum_{i=1}^c\sum_{x_j\in X_i}(x_j-\mu_i)(x_j-\mu_i)^T
SW=∑i=1c∑xj∈Xi(xj−μi)(xj−μi)T
其中
S
W
S_W
SW为反映同类中相似度的散点矩阵,
μ
i
\mu_i
μi为第i类的平均值。
求特征值方程:
S
B
v
i
=
λ
i
S
W
v
i
S_Bv_i=\lambda_iS_Wv_i
SBvi=λiSWvi
其中
v
i
v_i
vi为第i个Fisher模型描述符。
2.解决的问题
将三维模型转换为二维投影图像时,无法用简洁的方式表示三维模型,没有抓住三维模型潜在的几何信息以及一些具有辨识度的信息,如颜色、纹理、外形等。
3.处理方法主要步骤
上图展示了整个流程的处理顺序,主要分为以下四步:
1) 输入三维模型数据库,包含训练集和测试集。
2) 对数据库中的每个三维模型提取热核特征描述符(HKS),然后根据热核特征描述符计算得到热模型描述符(HeatSD)。
3) 将得到的热模型描述符分别输入两个深度神经网络,利用主成分分析(PCA)得到Eigen特征描述符(ESD),利用线性判别分析(LDA)得到Fisher特征描述符(FSD)。
4) 分别用ESD和FSD作为目标值,训练两个编码器,从隐藏层中提取深度模型描述符(Deep Shape Descriptor,DeepSD)。
4.优点
1)训练得到的深度模型描述符,极大化类间差异以及极小化类内差异,有着较高的辨识度,提高了分类和检索的准确度。
2)深度模型描述符对三维模型上的数字噪声有较好的抵抗作用。
3)对不完整的三维模型仍然有较好的检索效果。