基于视频的行人再识别（1）：从认识Mars数据集开始

最新推荐文章于 2023-04-30 20:09:31 发布

余慈reid

最新推荐文章于 2023-04-30 20:09:31 发布

阅读量2.3w

点赞数 46

分类专栏： VIdeo ReID 文章标签： reid pytorch Mars数据集

本文链接：https://blog.csdn.net/qq_34132310/article/details/83869605

版权

VIdeo ReID 专栏收录该内容

7 篇文章 21 订阅

订阅专栏

1.Mars数据集

目前，基于视频的reid最大的数据集，应该就是2016年郑良老师开源的Mars（Motion Analysis and Re-identification Set）数据集。数据集的地址为
http://www.liangzheng.com.cn/Project/project_mars.html

最近官方下载链接好像失效了，我补一个网盘链接链接: https://pan.baidu.com/s/1XKBdY8437O79FnjWvkjusw
提取码: ymc5
数据集中的行人序列

2.下载完的Mars数据集

整个Mars数据的大小大概有6.3G，有两个名称为bbox_train和 bbox_test的文件夹。
同时你还应该下载一个关于数据集信息的info文件夹。info文件夹不包括在原始数据集中，下载地址为https://github.com/liangzheng06/MARS-evaluation/tree/master/info。完整版的Mars数据集包含的文件夹如下图所示。
在这里插入图片描述
进一步地，让我们来看看这三个文件夹中的内容。

3.bbox_train文件夹

bbox_train文件夹中，有625个子文件夹（代表着625个行人id），共包含了8298个小段轨迹（tracklets），总共包含509,914张图片。
在这里插入图片描述

4.bbox_test文件夹

bbox_test文件夹中共有636个子文件夹（代表着636个行人id），共包含了12180个小段轨迹（tracklets），总共包含681,089张图片。在实验中这个文件夹被划分为图库集（gallery）+ 查询集（query）。在info文件夹中会解释这件事。
名称为00-1子文件夹表示无用的图片集，他们对应的行人id被设为**-1**，一般在算法中直接无视pid = -1的图片。
而名称0000子文件夹中，他们对应的行人id被设为0，表示干扰因素，对检索准确性产生负面影响。
在这里插入图片描述

5.info文件夹

info文件夹中包含了5个子文件，包含了整个数据集的信息，目的是方便使用数据集。
在这里插入图片描述

1. train_name.txt文件
这个txt文件里，按照顺序存放bbox_train文件夹里所有图片的名称，一共有509,914行。
在这里插入图片描述
既然在这里出现了图片名称，就顺带解释下图片的命名规则。以图片名称
0065 C1 T0002 F0016.jpg为例。
0065表示的行人的id，也就是 bbox_train文件夹中对应的 0065子文件夹名；
C1表示摄像头的id，说明这张图片是在第1个摄像头下拍摄的（一共有6个摄像头）；
T0002表示关于这个行人视频段中的第2个小段视频（tracklet）；
F0016表示在这张图片是在这个小段视频（tracklet）中的第16帧。在每个小段视频（tracklet）中，帧数从 F0001开始。
2. test_name.txt文件
同样地，在这个txt文件中，按照顺序存放bbox_test文件夹里所有图片的名称，一共有681,089行。
在这里插入图片描述
3. tracks_train_info.mat文件
.mat格式的文件是matlab保存的文件，用matlab打开后可以看到是一个8298 * 4的矩阵。
矩阵每一行代表着一个tracklet；
第一列和第二列代表着图片的序号，这个序号与 train_name.txt文件中的行号一一对应；
第三列是行人的id，也就是 bbox_train文件夹中对应的子文件夹名；
第4列是对应的摄像头id（一共有6个摄像头）。
在这里插入图片描述
4. tracks_test_info.mat文件
这个文件用matlab打开后可以看到是一个12180 * 4的矩阵。
矩阵每一行代表着一个tracklet；
第一列和第二列代表着图片的序号，这个序号与 test_name.txt 文件中的行号一一对应；
第三列是行人的id，也就是 bbox_test文件夹中对应的子文件夹名；；
第4列是对应的摄像头id（一共有6个摄像头）。
在这里插入图片描述
5. query_IDX.mat文件
这个文件用matlab打开后可以看到是一个1 * 1980的矩阵，可以看到每一列是对应上面 tracks_test_info.mat文件中的第几行。
比如1978列中的值为12177，对应的是 tracks_test_info.mat文件中的第12177行。
而12177行中，可以看到其id=1496。不难发现同样id=1496的行还有12166, 12167等。其实这说明在名称为1496子文件夹中，有多个小段视频（tracklet）。
值得注意的是，并不是所有查询集的id，图库都有对应的相同id行人的行。在1980个查询id中，有效的id（在图库中存在相同id的行）数 = 1840。
也就是说，有些文件夹里只有1个tracklet。
在这里插入图片描述

结语

Mars数据集就介绍到这，若有问题，欢迎大家与我交流，我的邮箱为asuradayuci@gmail.com。github就先不放了。。下次再说。
接下来会介绍如何基于Mars数据集，实现video_based person-ReId。然后会介绍一些目前自己见到的一些用在reid上的一些注意力机制等。