2020 CROSS-MODAL GUIDANCE NETWORK FOR SKETCH-BASED 3D SHAPE RETRIEVAL 学习日记

HwenT7711

于 2023-01-01 11:51:16 发布

阅读量183

点赞数

文章标签： sketch 3d 学习

本文链接：https://blog.csdn.net/weixin_44362232/article/details/128510510

版权

文章目录

本文的创新点
知识蒸馏
模型框架
引导损失函数
实验结果
- 消融实验

本期论文：
@article{Dai2020CrossModalGN,
title={Cross-Modal Guidance Network For Sketch-Based 3d Shape Retrieval},
author={Weidong Dai and Shuang Liang},
journal={2020 IEEE International Conference on Multimedia and Expo (ICME)},
year={2020},
pages={1-6}
}

原文链接

本文的创新点

将基于草图的三维模型检索任务分为两个步骤：
1.三维模型的分类
2.二维草图的特征转移
提出一个跨模型引导网络（CGN）用来做基于草图的三维模型检索任务，发挥预先学习的三维模型的特征空间的优势来引导草图的特征学习，有效的减少了跨模态差异。
-本文的模型在SHREC‘13和SHREC’14两个数据集上取得了不错的性能。

知识蒸馏

知识蒸馏主要是提出一个特征转移的模型——通过依靠在一个强有力的教师网络中学习到的知识来提升学生网络的训练。相关论文链接如下：

Distilling the knowledge in a neural network
Model compression

在本文中，作者将蒸馏网络的模型推动进入基于草图的三维模型检索来有效减少跨模态的差异。

模型框架

在这里插入图片描述

本文提出的模型主要是由“老师”/分类网络，学生“转移”网络，和预先学习的三维模型的特征空间三部分组成。

Pipeline：

首先，本文通过训练教师网络来学习三维模型的形状，在这个工作之前，先获取12个角度下三维模型的二维投影视图，随后多个Views分别通过CNN-2，所有分支的CNN-2参数是共享的。采用AM-Softmax来作为分类网络的损失函数，AM-Softmax函数可以扩大类间距离，而缩小类内距离。AM-Softmax更多解释如下文所示：
AM-Softmax
在CNN-2的输出后采用一个平均池化层用来融合特征。在教师网络的训练后，三维模型的训练数据再一次经过教师网络，并且通过FCN-2后提取到的特征来获得预先学习的三维模型的特征空间。最终，我们通过计算同一类特征的平均值来，获得每一个类的类心。
我们在预先学习到的三维模型的类心的引导下训练学生网络，在本文提出的引导损失函数的监督下将草图的特征转移到预先学习的特征空间中。
测试阶段，查询草图的特征和三维模型分别在FCN-1和FCN-2后被抽取得到，然后查询草图和相应三维模型的相似性被计算得到并进行排序，我们采用余弦距离来计算相似度。