基于预训练的CNN特征实现RGB-D目标识别与姿态估计笔记——(2015)
RGB-D Object Recognition and Pose Estimation based on Pre-trained Convolutional Neural Network Features(2015)
摘要
- 文章通过深度卷积神经网络(CNN)的转移学习来解决训练数据集的问题,提供丰富的,语义上有意义的特征集。融合CNN未经训练的深度信息(通过从规范视角渲染目标并根据与目标中心的距离着色深度通道)。
引言
- 数据集不够——重复利用CNN在大范围任务中学到的特征,并将其应用于较小的家庭对象数据集上的不同任务中。
- 文章算法对目标进行分割,去除混杂背景信息并将它们调整为CNN的输入分布。然后将CNN计算的特征送到支持向量机(SVM),确定目标类,实例和姿势。
- 转换深度数据,使在彩色图像上训练的CNN容易理解。
- 文章贡献:
(1)提出新的RGB-D图像预处理pipeline,便于CNN进行目标分类,实例识别和姿势回归。
(2)分析我们的pipeline和预训练的CNN产生的特征。它们自然地将常见的家庭目标类别及其实例分开,并产生低维度的姿态流形。