基于视频的行人再识别(1):从认识Mars数据集开始

1.Mars数据集

目前,基于视频的reid最大的数据集,应该就是2016年郑良老师开源的Mars(Motion Analysis and Re-identification Set)数据集。数据集的地址为
http://www.liangzheng.com.cn/Project/project_mars.html

最近官方下载链接好像失效了,我补一个网盘链接链接: https://pan.baidu.com/s/1XKBdY8437O79FnjWvkjusw
提取码: ymc5
数据集中的行人序列

2.下载完的Mars数据集

整个Mars数据的大小大概有6.3G,有两个名称为bbox_trainbbox_test的文件夹。
同时你还应该下载一个关于数据集信息的info文件夹。info文件夹不包括在原始数据集中,下载地址为https://github.com/liangzheng06/MARS-evaluation/tree/master/info。完整版的Mars数据集包含的文件夹如下图所示。
在这里插入图片描述
进一步地,让我们来看看这三个文件夹中的内容。

3.bbox_train文件夹

bbox_train文件夹中,有625个子文件夹(代表着625个行人id),共包含了8298个小段轨迹(tracklets),总共包含509,914张图片。
在这里插入图片描述

4.bbox_test文件夹

bbox_test文件夹中共有636个子文件夹(代表着636个行人id),共包含了12180个小段轨迹(tracklets),总共包含681,089张图片。在实验中这个文件夹被划分为图库集(gallery)+ 查询集(query)。在info文件夹中会解释这件事。
名称为00-1子文件夹表示无用的图片集,他们对应的行人id被设为**-1**,一般在算法中直接无视pid = -1的图片。
而名称0000子文件夹中,他们对应的行人id被设为0,表示干扰因素,对检索准确性产生负面影响。
在这里插入图片描述

5.info文件夹

info文件夹中包含了5个子文件,包含了整个数据集的信息,目的是方便使用数据集。
在这里插入图片描述

1. train_name.txt文件
这个txt文件里,按照顺序存放bbox_train文件夹里所有图片的名称,一共有509,914行。
在这里插入图片描述
既然在这里出现了图片名称,就顺带解释下图片的命名规则。以图片名称
0065 C1 T0002 F0016.jpg为例。
0065表示的行人的id,也就是 bbox_train文件夹中对应的 0065子文件夹名;
C1表示摄像头的id,说明这张图片是在第1个摄像头下拍摄的(一共有6个摄像头);
T0002表示关于这个行人视频段中的第2个小段视频(tracklet);
F0016表示在这张图片是在这个小段视频(tracklet)中的第16帧。在每个小段视频(tracklet)中,帧数从 F0001开始。
2. test_name.txt文件
同样地,在这个txt文件中,按照顺序存放bbox_test文件夹里所有图片的名称,一共有681,089行。
在这里插入图片描述
3. tracks_train_info.mat文件
.mat格式的文件是matlab保存的文件,用matlab打开后可以看到是一个8298 * 4的矩阵。
矩阵每一行代表着一个tracklet;
第一列和第二列代表着图片的序号,这个序号与 train_name.txt文件中的行号一一对应;
第三列是行人的id,也就是 bbox_train文件夹中对应的 子文件夹名
第4列是对应的摄像头id(一共有6个摄像头)。
在这里插入图片描述
4. tracks_test_info.mat文件
这个文件用matlab打开后可以看到是一个12180 * 4的矩阵。
矩阵每一行代表着一个tracklet;
第一列和第二列代表着图片的序号,这个序号与 test_name.txt 文件中的行号一一对应;
第三列是行人的id,也就是 bbox_test文件夹中对应的 子文件夹名;;
第4列是对应的摄像头id(一共有6个摄像头)。
在这里插入图片描述
5. query_IDX.mat文件
这个文件用matlab打开后可以看到是一个1 * 1980的矩阵,可以看到每一列是对应上面 tracks_test_info.mat文件中的第几行。
比如1978列中的值为12177,对应的是 tracks_test_info.mat文件中的第12177行。
而12177行中,可以看到其id=1496。不难发现同样id=1496的行还有12166, 12167等。其实这说明在 名称为1496子文件夹中,有多个小段视频(tracklet)。
值得注意的是, 并不是所有查询集的id,图库都有对应的相同id行人的行。在1980个查询id中,有效的id(在图库中存在相同id的行)数 = 1840。
也就是说,有些文件夹里只有1个tracklet。
在这里插入图片描述

结语

Mars数据集就介绍到这,若有问题,欢迎大家与我交流,我的邮箱为asuradayuci@gmail.com。github就先不放了。。下次再说。
接下来会介绍如何基于Mars数据集,实现video_based person-ReId。然后会介绍一些目前自己见到的一些用在reid上的一些注意力机制等。

  • 45
    点赞
  • 133
    收藏
    觉得还不错? 一键收藏
  • 52
    评论
Mars数据集准确度是指该数据集所包含的信息与真实情况的接近程度。由于研究Mars的任务是非常复杂和困难的,因此数据集的准确度对于科学家和研究人员来说至关重要。 对于Mars数据集的准确度,我们需要综合考虑多个方面。首先,数据的收集和处理过程必须是科学严谨的。科学家必须采用精确的测量设备和仪器,以确保数据的准确性。例如,对于大气成分的测量,需要使用高精度的气体分析仪,以避免测量误差。此外,科学家还需要对数据进行仔细的校正和验证,以消除任何可能的系统误差。 其次,数据集的准确度还取决于数据的来源和获取方式。例如,如果数据是通过探测器收集的,那么我们需要确保探测器的传感器和设备能够准确地记录和传输数据。此外,合理的数据采样策略也非常重要,以保证数据集的全面性和代表性。 最后,对于Mars数据集的准确度评估,我们还需要考虑到科学家和研究人员的主观判断。他们会使用不同的分析方法和模型来研究数据,这可能会对数据集的准确度产生影响。因此,在对数据集进行分析和解释时,科学家必须尽可能地遵循科学规范和方法,以确保他们的结论是准确和可靠的。 综上所述,Mars数据集的准确度是一个复杂的问题,它需要综合考虑数据的收集、处理、来源和解释等多个因素。只有在这些方面都得到合理的保证和验证后,我们才能对Mars数据集的准确性有一个相对准确的评估。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 52
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值