一、提出问题
现实情况中在跨视角摄像机下,同一行人的姿态是多变的,而现有方法缺乏在大的姿势变化时跨视角的训练数据对及在这种情况下差异性特征和不变性特征的学习。
二、论文贡献
- 作者认为姿势的多变性是使深度re-id模型学习不到有效身份特征和视角不敏感特征的最重要原因,本文提出一种基于生成姿态归一化图像的解决方案,解决了现有模型可扩展性和泛化性弱的问题;
- 提出了一种行人图像生成模型PN-GAN,用于生成逼真的、身份一致的、姿态可控的姿态归一化图像。利用规范姿势的合成图像,学习互补的特征并与用原始图像学习的特征相结合,在几种标准数据集上本文的方法达到了SOTA;
- 本文考虑了一种更为现实的无监督迁移学习。目标数据集中没有数据用于模型更新,即从标记源域训练的模型无需任何修改就可以应用于目标域。
三、模型结构
3.1 问题定义及概述
问题定义:设训练集为包含N个行人的数据集,
和
为第k个行人的图像与id,在训练阶段,图像I经过特征提取函数
提取到的特征为
,而在测试阶段,需要判断测试集
中的行人的图像对
是否为同一身份,即
或者
,这一过程是通过计算
和