这是一篇关于peson re-identification(PRID)的综述文章,文章链接https://arxiv.org/abs/1610.02984。
文章很长, 内容涉及到的材料也很多,从PRID的前世讲到今生和未来,大体上把这个问题分为image-based和video-based两类,重点讲述了两类问题里面特征的提取和距离指标的计算,难能可贵的是survey到了deep learning现在这个炽手可热的技术在PRID上的应用。内容很多,这里讲分阶段写一下关于这篇文章的内容,不定时的做补充和修改。
一,开篇
文章以荷马史诗故事开篇,很有新意。引出了关于re-ID的一个古老定义
总之就是去识别一个感兴趣的人是否在另一个摄像机里出现过。 一个PRID系统可以分为三步,即行人检测,行人跟踪,和行人召回。这里提到的PRID值得大多数是行人召回。 PRID的最大挑战就是如何正确的匹配不同camera下的两个person 图像,因为图像会受到lighting,pose,和视角等影响。
对于PRID的历史记住下面几个时间节点
- 1997,最初PRID是作为multi-camera tracking问题提出的。Huang和Rueesll提出了bayesian formulation来做此类工作。
- 2005, Wojciech Zajdel 等第一次用到了re-identification这个说法
- 2006,Gheissari 应用了visual cues of persons after a spatial-temporal segmentation algorithm. PRID正式作