Abstract:本文提出了一种基于深度学习的行人再识别的方法,该方法通过传递中层属性特征和高层分类特征来实现。基于身份分类、属性识别和再识别,共享相同的中层语义表达思想,他们可以通过在一个的基础上对另一个进行微调来依次进行训练。在这个框架中,通过深度卷积神经网络来训练身份分类和属性识别任务来学习人的信息。在很大程度上信息可以转移到人的重识别任务中,并提高其准确性。并且提出了一种基于长短期记忆(LSTM)的递归神经网络组件。该组件在reid模型中用于注意每个循环单元的某些空间部分。通过实验表明,这个方法在CUHK03数据集上的识别精度达到了78.3%。
1、Introduction:
- 行人重识别的目标是在一组不重叠的摄像头下匹配行人,这为视频监控提供了很大的支持,并且也节省了很多人力的劳动,能够提高行人的追踪性能。但是在重新识别的时候还存在着一些困难,比如个人的姿态有着变化,外界环境的改变,以及不同人之间的差异性等等。
- 传统的reid方法主要侧重于颜色,形状等较低层次的特征来描述人的外观的特征,但是这些低层特征对于reid问题的描述并不可靠。
- 三个主要的贡献:
- 提出了一种跨领域的知识转移训练方案,该方案将模型按顺序在不同数据分布的数据集上进行训练。
- 提出一种基于spacial gate的LSTM网络用于行人再识别,这有助于模型在测试集上有更好的性能。
- 在其他的数据集上进行实验,发现这种方法具有很好的性能。
2、Related Work
现有的行人重识别有两种方法:feature representation learning 和 distance metric learning,下面讨论一些与这两种方法相关的:
- Deep learning based re-id:一方面,在深度学习技术的快速推动下,利用dCNN从原始图像中提取特征,并提出多种将dCNN特征嵌入到搜索空间的方法,称之为深度度量学习。siamese network structure将深度特征提取和识别融入到一个框架中,广受使用者的欢迎。另一方面triplet loss的提出,在排序问题上取得了巨大的成功。
- Knowledge transfer for person re-id:深度学习是靠数据驱动的,但是大量的数据训练需要耗费很多的人力物力。迁移学习能够很好的改变这一状况,迁移学习是通过将现有的知识应用到新的领域的任务中去。迁移学习在之前就被应用到了reid中,传统的方法倾向于直接使用属性作为图像的描述符。最近Su等人提出了从独立属性数据集]和行人跟踪数据集学习深度属性特征的三阶段过程,然后在person re-id数据集上测试其特征。
3、Method
对于三个不同的任务,网络训练在三个不同的数据集中进行训练。结构图如下:
分类任务使用带标签的Market1501 数据集,最终全连接层使用1501个输出结点。属性识别任务使用与分类任务使用的结构相似,使用sigmoid作为损失函数,并且最后的全连接层有105个结点。在reid框架中,将三幅图作为一个三元组,以上两个训练都为reid提供参数。特征提取器由dCNN和LSTM组成。在从特征提取器中得到三个归一化的特征之后,把triplet loss作为最终的损失函数。