论文链接:https://arxiv.org/abs/1701.08398v3
【Abstract】当把Re-ID作为一个图像检索问题时,re-ranking是提高其准确性的关键步骤。然后,在Re-ID研究领域,很少有paper是专注于re-ranking。尤其是那些全自动、无监督的解决方案。这篇Paper提出一种 k-reciprocal 编码方法来对Re-ID结果进行 re-ranking。这里假设:如果一张gallery集中的图片跟 k-reciprocal近邻中的probe 是很类似的话,那么它很有可能是一个真正的匹配。具体来说,对于给定的一张图片,通过将其 k-reciprocal 最近邻编码为一个向量来计算 k-reciprocal特征。该向量用于在 Jaccard距离下的 re-ranking。最后的距离是原始距离和Jaccard距离的加权和。本文提出的方法不需要任何的交互操作和标签数据,所以将此方法应用到更大规模的数据集上。在 Market-1501,CUHK03,MARS,以及 PRW 数据集上验证了本文方法的有效性。
【Introduction】行人重识别(Re-ID)是一个富有挑战性的计算机视觉任务。通常情况下,可以将Re-ID看作一个检索问题。对于给定的探测对象(probe),我们期望在 gallery数据集中找到该探测对象(gallery数据集就是包含许多probe不同姿态和不同背景下的拍摄到的图片)。在获得一个初始的ranking排名列表后,一个好的优化方法是对初始ranking进行re-ranking操作,让那么与probe相关的图像获得更高的排名。所以这篇Paper的主要工作在Re-ranking这块。
re-ranking 已经在 instance retrieval 领域取得了诸多研究进展,许多 re-ranking 方法的优点在于,它可以在不需要额外的训练样本的情况下实现,并且可以应用到任何一种初始 ranking。
此外,re-ranking 的有效性很大程度上取决于 initial ranking 的质量。之前一部分的研究工作利用inital ranking 列表中 top-ranking 图片之间的相似性关系取得不错的实验效果。一个潜在的假设,如果检索返回的图像在probe的k近邻中,那么这张图像很有可能是一个真的匹配,可以用于后续的 re-ranking。然后,现实情况往往会是:错误的匹配的图像很有可能就在probe的k近邻中。如下图1所示,P1、P2、P3、P4是4张真的匹配结果,但是这4张检索匹配结果并没有出现在top-4 里。可以观察到N1到N6这6张在ranking list中排名很高,top-10 出现6张。直接使用top-k 图片进行re-ranking操作,不利于提升re-ranking的效果。
通过阅读诸多文献发现针对上述问题,k-reciprocal 最近邻是一种很有效的解决方法。
综合上述,这篇paper引入 k-reciprocal 编码到行人重识别研究工作中。这篇paper的方法主要包含三步:
1. 我们对加权的k-reciprocal 近邻集合编码成一个N维向量形成k-reciprocal特征,两张图片之间的Jaccard距离可以通过k-reciprocal特征进行计算
2. 为了获得更鲁棒的k-reciprocal特征,我们引入local query expansion方法来进一步提升re_DI的性能。
3. 最终的距离是原始距离和Jaccard距离的加权和,根据得到的最终距离生成新的 re-ranking 列表。
这篇paper的算法框架如下图所示:
【Proposed Approach】
问题定义:给定probe person 以及gallery 数据集(数据集规模——有
张图片)
,person
和
原