行人重识别ReID中的CMC和mAP
本文主要是在学习文章“Person Re-Identification by Deep Learning Multi-Scale Representations”时想到把相关的知识总结出来,文章的主题为ReID中多尺度的问题,会在后续更新文章的详细介绍。
文章地址:paper下载地址
参考博客:ReID任务中的CMC和mAP
行人重识别-ReID
行人重识别(Person re-identification, ReID),指利用计算机视觉技术对图像集或者视频序列中是否存在某特定目标进行判断。随着卷积神经网络(CNN)方法的广泛研究,ReID利用CNN进行特征提取并进行特征分类以实现匹配问题。
ReID任务可描述如下:
给定一个Gallery集合G作为被检测集合,包含有N张图片,分属M个ID(identity)。给定一张未知ID的图片做Query(或者叫probe), 通过训练集对ReID模型进行训练,在训练好的模型上进行Galleery与Query的特征相似度计算,对于每个Query,在Gallery中找出前N个与其相似的图片。下图是一个典型的ReID任务.
对于一个ReID任务,如何进行评价呢?就是使用CMC以及mAP。
CMC
累计匹配特性(Cumulative Matching Characteristics, CMC),CMC曲线可以用来评价ReID的性能,需要引入一个概念Acc_K: 前k个gallery samples中包含query图像。
Acc_k = 1, if top-k ranked gallery samples contain query identity
Acc_k = 0, otherwise
举例来说:
- 比如,我们训练了一个分类器,来识别五个物体,即五个query图像1,2,3,4,5,他们属于3类即A,B,C。
- 属于A类的物体1,经过分类器,得到属于A、B、C类的概率是80%,15%,5%,所以将物体1,判定为A类,物体1经过一次排序就被命中正确的类,所以我们引入Rank-1为100%。
- 物体2本来属于B类,被我们训练的分类器分类为A、B、C的概率分别为50%,40%,10%,所以被判定为A类,按照概率排序,如果有两次机会,才能命中,这就是Rank-2的含义。
因此对于一个query集合来说:
- 若果每个都能第一次命中,所以五个物体的Rank分别是 rank-1 100% rank-2 100% rank-3 100%。
- 如果物体1,2为一次就命中,3,4为两次才能命中,5为三次命中,则为 rank-1 40% rank-2 80% rank-3 100%。
当query很大时,得到CMC曲线如下图所示:
mAP
mAP是mean Average Precision的缩写。表示查准率(AP)的平均值。此时,回归到re-id任务,我们关注的问题主要有两个:
- 查询返回的所有结果中,有多少结果是与query的ID相同的。
- 所有查询的同一个ID的图片中,有多少被查询返回了。
这两个关注的问题就涉及到我们平时所说的准确率和召回率两个概念。
准确率就是和query同一ID的图片在查询结果中的占比。
准
确
率
=
∣
{
同
一
I
D
图
片
}
⋂
{
查
询
结
果
所
有
图
片
}
∣
∣
{
查
询
结
果
所
有
图
片
}
∣
准确率 = \frac{\left |\left \{ 同一ID图片 \right \}\bigcap\left \{查询结果所有图片 \right \} \right |}{\left |\left \{ 查询结果所有图片 \right \}\right |}
准确率=∣{查询结果所有图片}∣∣{同一ID图片}⋂{查询结果所有图片}∣
召回率就是query同一ID的图片出现在查询结果中的数量占总数的比例。
准
确
率
=
∣
{
同
一
I
D
图
片
}
⋂
{
查
询
结
果
所
有
图
片
}
∣
∣
{
同
一
I
D
图
片
}
∣
准确率 = \frac{\left |\left \{ 同一ID图片 \right \}\bigcap\left \{查询结果所有图片 \right \} \right |}{\left |\left \{ 同一ID图片 \right \}\right |}
准确率=∣{同一ID图片}∣∣{同一ID图片}⋂{查询结果所有图片}∣