[行人重识别论文]Camera Style Adaptation for Person Re-identification

摘要:作为一项跨相机检索任务,人员重新识别会受到不同相机引起的图像风格变化的影响。该艺术通过学习相机不变描述符子空间隐含地解决了这个问题。在本文中,我们通过引入相机风格(CamStyle)适配来明确地考虑这一挑战。CamStyle 可以作为一种数据增强方法,可以消除相机风格差异。具体来说,使用 CycleGAN,可以将标记的训练图像样式传输到每个相机,并与原始训练样本一起形成增强训练集。这种方法在增加数据多样性以防过度拟合的同时,也会产生相当大的噪声。为了减轻噪声的影响,采用了标签平滑正则化(LSR)。我们方法的普通版本(不带 LSR)在经常发生过度拟合的少数相机系统上表现相当不错。

贡献:

  1. 用于重新识别数据增强的普通相机感知风格传输模型。在少数摄像头系统中,改进幅度可高达17.1%。
  2. 一种在重新识别训练期间对样式转移样本应用LSR的改进方法。在全摄像头系统中,观察到持续的改进。

相机感知风格转移模型是从不同相机之间的真实训练数据中学习的。对于每张真实图像,我们可以利用经过训练的传递模型来生成适合目标相机风格的图像。随后,将真实图像(绿色框)和样式转移图像(蓝色框)组合在一起,以训练重新识别 CNN。将交叉熵损失和标签平滑正则化(LSR)损失分别应用于真实图像和样式转移图像。

以下分别为最开始的区分样本正负和标签正则化后,但是产生的样本可能存在噪声,需要用标签平滑正则化,对于真实图像,我们不使用 LSR,因为它们的标签与图像内容正确匹配,需要正则化的是增强后的样本。

如上图所示在Market-1501的训练小批量中使用不同比例的真实数据和虚假数据(M:N)进行评估。可以看出,不同M:N的CamStyle在基线上持续改进。当在每个小批量中使用比真实数据(M : N < 1)更多的虚假数据时,我们的方法在 rank-1 的准确性上略微提高了约 1%。 相反,当 M : N > 1 时,我们的方法将 rank-1 的准确性提高了 2% 以上。当 M : N = 3 : 1 时,性能达到最佳。

结论:

在本文中,我们提出了CamStyle,一种用于深度人物重新识别的相机风格适应方法。使用 CycleGAN 为每对相机学习相机感知样式传输模型,用于从原始图像生成新的训练图像。真实图像和风格转移的图像构成了新的训练集。此外,为了减轻 CycleGAN 引起的噪声水平增加,对生成的样本应用了标签平滑正则化 (LSR)。在Market-1501和DukeMTMC-reID数据集上的实验表明,我们的方法可以有效地降低过拟合的影响,并且当与LSR结合使用时,可以产生比基线的持续改进。此外,我们还表明,我们的方法与其他数据增强技术相辅相成。在该功能中,我们将 CamStyle 扩展到单视图学习和领域适配。

总结:

本文章主要创新了数据增强方式来补充样本数量,主要解决了过拟合问题,但是同时产生了较大噪声,通过使用标签平滑正则化来减弱噪声的影响

本文内容来自于论文:Camera Style Adaptation for Person Re-identification

  • 8
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值