MARS:
行人重识别最大的视频数据集,由market1501扩充而成
包含1261个人的17,503tracklets 和3,248个干扰tracklets(false detect / track的序列)
由6个近乎同步的相机拍摄而成
分成625人的训练集和636人的测试集,multi-query和multi-ground truth
每个人平均13个tracklets 、816帧(每个人至少有两个在不同摄像头下地tracklets)
bounding boxes被检测和跟踪使用Deformable Part Model (DPM) and GMMCP tracker
DukeMTMC:
一个适合多摄像头跟踪的大规模数据集。在室外场景拍摄,有较大的背景噪声、光照、姿势、视角、遮挡的变化
DukeMTMC-VideoReID:
DukeMTMC的子集,人工标注,每人仅有在一个摄像头下的一个tracklet
作者在视频中裁切行人图片,每秒裁12帧,产生一个tracklet
数据集702人用于训练,702人用于测试,408人是distractors
最终,作者产生了369,656 frames of 2,196 tracklets用于训练,445,764 frames of 2,636 tracklets用于测试和distractors
PRID 2011:
由两个不同视角的静止摄像机拍摄,有不同的光照、背景、摄像头特征
一个摄像头拍摄385个人,另一个拍摄749个人。仅仅前200个人出现在两个摄像头里
每个video包含5-675帧,平均每个video100帧
ILIDS-VID:
2个不重叠摄像头拍摄的300个不同的人
包含600个tracklets
每个video中每个人有23-192帧,平均73帧
因为这个数据集是在机场到达大厅多摄像头网络拍摄,挑战性较大,因为随着摄像头变化,衣服相似度、光照、视角变化很大