VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera

最新推荐文章于 2022-05-06 20:23:32 发布

s123l4

最新推荐文章于 2022-05-06 20:23:32 发布

阅读量808

点赞数

分类专栏：车辆重识别文章标签：计算机视觉

本文链接：https://blog.csdn.net/s123l4/article/details/109275790

版权

车辆重识别专栏收录该内容

18 篇文章 13 订阅

订阅专栏

链接：https://arxiv.org/pdf/2004.09164.pdf

摘要：

车辆的再识别是一项具有挑战性的任务，其主要原因是类内方差高，类间方差小。在这篇文章中，我们着重研究了由于相似的背景和形状而导致的失效案例。它们对相似性提出了偏见，使得细粒度信息更容易被忽略。为了减少这种偏差，我们提出了一种名为voci - reid的方法，将三元组车辆方向相机作为一个整体，将背景/形状相似性转化为相机/方位重新识别。首先，分别对车辆模型、方位模型和相机再识别模型进行了训练。然后以方向和摄像机相似度作为惩罚，得到最终的相似度。此外，我们还提出了一种基于小技巧和弱监督数据增强的高性能基线。
贡献：

我们认为背景的相似性可以解释为相机的再识别，形状的相似性可以解释为方向的再识别。
为了减少背景和形状的偏差，我们提出了voci - reid方法，该方法将三元组方向相机作为一个整体。据我们所知，在车辆再识别任务中，我们是第一个将车辆、方位和相机信息联合起来的。
在不使用任何额外数据和注释的情况下，我们的方法在NVIDIA AI City Challenge 2020的车辆识别领域中排名第二。在VeRi776数据集[2]上，它的性能也优于目前最先进的方法。

在这里插入图片描述

图1所示。训练框架的总体设计:RECT-Net，即ResNet骨干，GeM pooling, Circle loss [8]，和三元组的损失。
GeM：广义均值池。全局平均池在分类任务中广泛使用，但对于细粒度的实例检索任务来说，它不是一个好选择，就像车辆重新识别一样。在[23]中，广义均值（GeM）池被提议为：在这里插入图片描述
平均池和最大池都是GeM池的特殊情况，当p→∞时退化为最大池，当p = 1时退化为平均池。在我们的车辆re-id实验中，GeM池取得了优于全局平均池的性能。
相关代码：

Data Augmentation: Weakly Supervised Detection为了提高模型的精度和避免过拟合，数据增强被广泛应用。在我们的方法中一个重要的数据增强工作是弱监督检测增强。受到[12,13]的启发，我们训练一个初始vehicle ReID模型，以获得每个图像的热图响应，并设置一个阈值，以获得比其更大的边界框。与有监督的检测方法相比，该方法产生了更紧密的裁剪车辆，聚焦于reid模型的注意区域。经过弱监督检测后，我们得到了训练和测试集的裁剪副本。训练集与原始图像一起使用。因此，在应用了弱监督数据增强之后，我们的数据集会翻倍。在我们的训练阶段还使用了其他常用的数据增强方法，如随机擦除[24]，颜色抖动等。
在这里插入图片描述
图2。提出的voci - reid系统的总体框架。它包括三个部分:Vehicle RECT-Net，输出车辆相似度;方向RECT-Net，输出方向相似度;Camera RECT-Net，输出相机相似度。最后采用直接的距离融合的方法将这三个输出融合在一起，得到最后的输出距离矩阵。
在这里插入图片描述
图3。一些假预测的车辆网(红色矩形表示假预测)。如a行和b行显示:Vehicle RECTNet通常预测方向相似的车辆为相同的车辆ID。如c行和d行显示:Vehicle RECTNet通常预测背景相似的车辆为相同的车辆ID。

图4。被vocl - reid纠正的失败案例。每组都显示了应用方位/摄像头感知ReID前后的对比。第一行是不包含方位/摄像头ReID的结果，而第二行表示包含方位和摄像头ReID的结果