DukeMTMC-reID 数据集
DukeMTMC-reID 数据集是 2017 年发布的一个大规模行人重识别图片数据集,它采集于 Duke 大学校园的 8 个静态摄像头。DukeMTMC-reID 数据集现已被广泛使用,学术界和工业界提出的 reID 算法模型都会使用它作为数据集。那么本文就来介绍一下 DukeMTMC-reID 数据集。
DukeMTMC-reID 数据集简介
DukeMTMC-reID 数据集是论文 Unlabeled Samples Generated by GAN Improve the Person Re-identification Baseline in vitro 提出的一个基于图片的行人重识别数据集。
它的行人数据来源于论文 Performance Measures and a Data Set for Multi-Target, Multi-Camera Tracking 提出的行人追踪 DukeMTMC 数据集,DukeMTMC-reID 是 DukeMTMC 数据集的一个子集。
DukeMTMC 数据集采集自 Duke 大学的 8 个摄像头,数据集以视频形式存储,具有手动标注的行人边界框。DukeMTMC-reID 数据集从 DukeMTMC 数据集的视频中,每 120 帧采集一张图像构成 DukeMTMC-reID 数据集。
DukeMTMC-reID 数据集的下载链接如下:
- 百度云下载链接
DukeMTMC-reID.zip - 谷歌云下载链接
DukeMTMC-reID.zip
DukeMTMC-reID 数据集结构
DukeMTMC-reID 数据集是依照 Market 1501 数据集的结构进行组织的,主要包括 bounding_box_test 、bounding_box_train 和 query 三个子集。
|File | Description |
| -------- | ----- |
|/bounding_box_test | The gallery images. We retrieve a query from this image pool.|
|/bounding_box_train | The training images. This dir contains the images from 702 different identities.|
|/query | The query images. Each of them is from different identities in different cameras.|
DukeMTMC-reID 数据集共采集到了 1812 个行人的 36,411 张图片。其中,1,404 个行人被超过 2 个摄像头捕捉到,而 408 个行人只被一个摄像头拍摄到。行人重识别本质上是一个跨镜搜索的任务,因此那 408 个行人不能用于行人重识别,只能作为干扰项加入数据集中。
- 训练集:bounding_box_train 包含 702 个行人,共 16522 张图片
- 测试集:bounding_box_test / gallery 包含 702 个行人 + 408 个干扰行人,共 17661 张图片
- query 集:包含测试集中的 702 个行人,在每个摄像头中为 702 个行人随机选择一张图片,共有 2228 张图片
DukeMTMC-reID 数据集命名规则
下图给出了 DukeMTMC-reID 数据集的几张行人图片,
以 0014_c2_f0053184.jpg 为例介绍数据集的命名规则:
- 0014 是行人 ID 编号
- c2 (camera 2)表示图片采集自第二个摄像头
- f0053184 (frame 53184) 表示图片是摄像头 2 的第 53184 帧