VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera

链接:https://arxiv.org/pdf/2004.09164.pdf

摘要:

车辆的再识别是一项具有挑战性的任务,其主要原因是类内方差高,类间方差小。在这篇文章中,我们着重研究了由于相似的背景和形状而导致的失效案例。它们对相似性提出了偏见,使得细粒度信息更容易被忽略。为了减少这种偏差,我们提出了一种名为voci - reid的方法,将三元组车辆方向相机作为一个整体,将背景/形状相似性转化为相机/方位重新识别。首先,分别对车辆模型、方位模型和相机再识别模型进行了训练。然后以方向和摄像机相似度作为惩罚,得到最终的相似度。此外,我们还提出了一种基于小技巧和弱监督数据增强的高性能基线。
贡献:

  • 我们认为背景的相似性可以解释为相机的再识别,形状的相似性可以解释为方向的再识别。
  • 为了减少背景和形状的偏差,我们提出了voci - reid方法,该方法将三元组方向相机作为一个整体。据我们所知,在车辆再识别任务中,我们是第一个将车辆、方位和相机信息联合起来的。
  • 在不使用任何额外数据和注释的情况下,我们的方法在NVIDIA AI City Challenge 2020的车辆识别领域中排名第二。在VeRi776数据集[2]上,它的性能也优于目前最先进的方法。

在这里插入图片描述

图1所示。训练框架的总体设计:RECT-Net,即ResNet骨干,GeM pooling, Circle loss [8],和三元组的损失。
GeM:广义均值池。 全局平均池在分类任务中广泛使用,但对于细粒度的实例检索任务来说,它不是一个好选择,就像车辆重新识别一样。 在[23]中,广义均值(GeM)池被提议为:在这里插入图片描述
平均池和最大池都是GeM池的特殊情况,当p→∞时退化为最大池,当p = 1时退化为平均池。在我们的车辆re-id实验中,GeM池取得了优于全局平均池的性能。
相关代码:
在这里插入图片描述
在这里插入图片描述

Data Augmentation: Weakly Supervised Detection为了提高模型的精度和避免过拟合,数据增强被广泛应用。在我们的方法中一个重要的数据增强工作是弱监督检测增强。受到[12,13]的启发,我们训练一个初始vehicle ReID模型,以获得每个图像的热图响应,并设置一个阈值,以获得比其更大的边界框。与有监督的检测方法相比,该方法产生了更紧密的裁剪车辆,聚焦于reid模型的注意区域。经过弱监督检测后,我们得到了训练和测试集的裁剪副本。 训练集与原始图像一起使用。因此,在应用了弱监督数据增强之后,我们的数据集会翻倍。在我们的训练阶段还使用了其他常用的数据增强方法,如随机擦除[24],颜色抖动等。
在这里插入图片描述
图2。提出的voci - reid系统的总体框架。它包括三个部分:Vehicle RECT-Net,输出车辆相似度;方向RECT-Net,输出方向相似度;Camera RECT-Net,输出相机相似度。最后采用直接的距离融合的方法将这三个输出融合在一起,得到最后的输出距离矩阵。
在这里插入图片描述
图3。一些假预测的车辆网(红色矩形表示假预测)。如a行和b行显示:Vehicle RECTNet通常预测方向相似的车辆为相同的车辆ID。如c行和d行显示:Vehicle RECTNet通常预测背景相似的车辆为相同的车辆ID。
在这里插入图片描述
在这里插入图片描述
图4。被vocl - reid纠正的失败案例。每组都显示了应用方位/摄像头感知ReID前后的对比。第一行是不包含方位/摄像头ReID的结果,而第二行表示包含方位和摄像头ReID的结果

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值