[行人重识别论文]Camera Style Adaptation for Person Re-identification

xiyue-

已于 2023-12-28 20:50:20 修改

阅读量445

点赞数 8

分类专栏： reid 文章标签：计算机视觉人工智能机器学习

于 2023-12-28 20:48:47 首次发布

本文链接：https://blog.csdn.net/m0_59713773/article/details/135278070

版权

reid 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

摘要：作为一项跨相机检索任务，人员重新识别会受到不同相机引起的图像风格变化的影响。该艺术通过学习相机不变描述符子空间隐含地解决了这个问题。在本文中，我们通过引入相机风格（CamStyle）适配来明确地考虑这一挑战。CamStyle 可以作为一种数据增强方法，可以消除相机风格差异。具体来说，使用 CycleGAN，可以将标记的训练图像样式传输到每个相机，并与原始训练样本一起形成增强训练集。这种方法在增加数据多样性以防过度拟合的同时，也会产生相当大的噪声。为了减轻噪声的影响，采用了标签平滑正则化（LSR）。我们方法的普通版本（不带 LSR）在经常发生过度拟合的少数相机系统上表现相当不错。

贡献：

用于重新识别数据增强的普通相机感知风格传输模型。在少数摄像头系统中，改进幅度可高达17.1%。
一种在重新识别训练期间对样式转移样本应用LSR的改进方法。在全摄像头系统中，观察到持续的改进。

相机感知风格转移模型是从不同相机之间的真实训练数据中学习的。对于每张真实图像，我们可以利用经过训练的传递模型来生成适合目标相机风格的图像。随后，将真实图像（绿色框）和样式转移图像（蓝色框）组合在一起，以训练重新识别 CNN。将交叉熵损失和标签平滑正则化（LSR）损失分别应用于真实图像和样式转移图像。

以下分别为最开始的区分样本正负和标签正则化后，但是产生的样本可能存在噪声，需要用标签平滑正则化，对于真实图像，我们不使用 LSR，因为它们的标签与图像内容正确匹配，需要正则化的是增强后的样本。

如上图所示在Market-1501的训练小批量中使用不同比例的真实数据和虚假数据（M：N）进行评估。可以看出，不同M：N的CamStyle在基线上持续改进。当在每个小批量中使用比真实数据（M ： N < 1）更多的虚假数据时，我们的方法在 rank-1 的准确性上略微提高了约 1%。相反，当 M ： N > 1 时，我们的方法将 rank-1 的准确性提高了 2% 以上。当 M ： N = 3 ： 1 时，性能达到最佳。

结论：

在本文中，我们提出了CamStyle，一种用于深度人物重新识别的相机风格适应方法。使用 CycleGAN 为每对相机学习相机感知样式传输模型，用于从原始图像生成新的训练图像。真实图像和风格转移的图像构成了新的训练集。此外，为了减轻 CycleGAN 引起的噪声水平增加，对生成的样本应用了标签平滑正则化（LSR）。在Market-1501和DukeMTMC-reID数据集上的实验表明，我们的方法可以有效地降低过拟合的影响，并且当与LSR结合使用时，可以产生比基线的持续改进。此外，我们还表明，我们的方法与其他数据增强技术相辅相成。在该功能中，我们将 CamStyle 扩展到单视图学习和领域适配。

总结：

本文章主要创新了数据增强方式来补充样本数量，主要解决了过拟合问题，但是同时产生了较大噪声，通过使用标签平滑正则化来减弱噪声的影响

本文内容来自于论文：Camera Style Adaptation for Person Re-identification

xiyue-

关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
[行人重识别论文]Camera Style Adaptation for Person Re-identification

在Market-1501和DukeMTMC-reID数据集上的实验表明，我们的方法可以有效地降低过拟合的影响，并且当与LSR结合使用时，可以产生比基线的持续改进。当在每个小批量中使用比真实数据（M ： N < 1）更多的虚假数据时，我们的方法在 rank-1 的准确性上略微提高了约 1%。以下分别为最开始的区分样本正负和标签正则化后，但是产生的样本可能存在噪声，需要用标签平滑正则化，对于真实图像，我们不使用 LSR，因为它们的标签与图像内容正确匹配，需要正则化的是增强后的样本。
复制链接

扫一扫