长期换衣行人重识别(Long-Term Clothes-Changing Person Reid)数据集汇总

总览

在长期换衣行人重识别的任务当中,数据集的获取(尤其是对于学术环境下)是一个难点,主要的困难有以下几点:

  1. 采集大规模的数据集比较困难。
  2. 采集不同的衣服的数据集比较困难。
  3. 采集不同衣服不同角度的数据集比较困难。

目前也有一些数据集或多或少的能够解决相关的问题,在下面按照时间顺序进行一个总结,总结的具体内容会尽量简短的概括不同数据集的优缺点,以及相关的改进措施和未来的方向。

目前换衣数据集的主要问题

  1. 缺乏大规模的数据集(表现比较好的PRCC数据集也只有300+的id)
  2. 缺乏基于视频的数据集(可以提取步态特征,而步态我认为是最有力的特征),目前几乎全部的数据集都是基于单帧图片的。
  3. 大规模的数据集背景比较杂乱:例如LaST和Celeb-Reid,同时这两个数据集相互之间的cross-testing也比较好,但对于其他数据集的cross-testing比较差,因为他们俩采集过程比较相似(街拍和视频截图)。

数据集换衣/总体情况集统计

目前为止,完全换衣情况的数据集有:Deep Change,PRCC和Celebrities-reID, 总体的纯换衣服的子集占数据集总数如下图所示:

表格中换衣/总体代表有多套衣服的id占总id的比例。
在这里插入图片描述

DeepChange(2021)

DeepChange是2021年5月份新提出的数据集,包括1121个行人的170000多张图片,有17个摄像头,时间跨度为2年。

优点:是大规模的数据集,季节跨度有12个月,也就说明了该数据集会包含同一个人穿着四季的衣服,另外,在一天之内也有跨度,包含了不同时刻的数据。同时也有一定的图像序列可以用于提取步态特征。

缺点:整体的分辨率较低(128*64),但与现实情况较为贴近。

链接
Github
DeepChange

数据集样例:
在这里插入图片描述

LaST(2021)

Large-scale Spatio-Temporal数据集是 2021 年新发布的数据集。它是从电影和电视剧中不同角色的截图中捕获的,包含 10862 个人物,超过 228000 张图像。

优点:由于数据源的特殊性,会有不同的环境条件和角度,为模型的泛化提供了很好的数据。同时,这是目前最大的换衣数据集。

缺点:与Celebrities-reID类似,它也存在背景杂乱,无法提取步态特征的问题。

链接
Github
LaST

数据集样例
在这里插入图片描述

COCAS(2020)

COCAS是一个包含 5266 人的 62,382 张图片的大型数据集。

优点:所有数据均来自实拍,包括不同角度、灯光、室内或室外、遮挡等。每个人物有2-3套衣服,每套衣服有5-10张照片。

缺点:该数据集尚未开源。

链接:
COCAS

数据集样例
在这里插入图片描述

VC-Clothes(2020)

VC-Clothes是来自游戏 GTA-V 的虚拟数据集,包括 512 个id和 19,060 张图像。它还有一个基于真实世界的测试数据集包括来自 28 个id的 4,324 张图像。

优点:数据集足够大,也是基于视频的数据集。

缺点:但是因为它来自游戏,所以里面的人物都是按照预先设定好的动作移动的,这说明这个数据集实际上并不适合提取步态等特征。步态信息应该是因人而异的,但是这样的话是无法采用步态来区别人的。

链接
Github:
VC-Clothes

数据集样例
在这里插入图片描述

LTCC(2020)

LTCC 包括152个人物的17138张图像,提供12个摄像头在不同光照条件下的安防摄像头图像。

优点:有助于增强模型对不同环境的适应能力,尤其是在不同的光照条件下和摄像头的低分辨率下。

缺点:数据量小,模型无法充分训练小规模数据。

链接
Github
LTCC

数据集样例
在这里插入图片描述

PRCC(2019)

PRCC包括来自221个人物的33698张图片,3个不同的角度,还提供人物的轮廓草图图像,方便提取人的轮廓信息。 需要注意的是,目前该领域大部分的研究(2019年之后的)都会用PRCC作为一个基准来测试模型的表现,因为它是一个严格的换衣数据集。

优点:PRCC的规模足够大,从不同的角度有严格的两套不同的衣服,因此也被广泛用于评估长期换衣行人重识别模型的表现。

缺点:它的数据是基于图像的而不是基于视频的,因此给提取步态等生物特征带来了困难。

链接:
Github
PRCC

数据集样例:
在这里插入图片描述

Celebrities-reID(2019)

Celebrities-reID 是最早专门针对长期换衣行人重识别任务问题提出的数据集之一。它来自名人的街拍照片,用这种方式来解决数据集比较难采的问题,包括590个人和10,842张照片。

优点:解决了换衣服数据集不够大的问题,并提供足够的训练和测试数据。

缺点:一般背景杂乱,分辨率高于安防摄像头。这些缺点会导致训练出的模型在self-testing的表现比较好,但在cross-testing的表现比较差。

链接
Github
Celebrities-reID

数据集样例:
在这里插入图片描述

  • 8
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
### 回答1: DukeMTMC-reID是一个用于行人重识别研究的数据集,该数据集由Duke University的Multimedia Lab创建。它包含超过36,000个身份的超过16,000个视频序列和8个摄像头视角的4410个身份的超过2万个图像。这些数据由不同的摄像头拍摄,其中许多图像和视频序列包含遮挡,模糊或低光条件。 DukeMTMC-reID数据集已成为行人重识别领域的基准数据集之一,许多最新的研究工作都在该数据集上进行评估。 ### 回答2: DukeMTMC-reID 数据集是一个用于行人重识别任务的开放源数据集。该数据集是在DukeMTMC数据库的基础上构建而成,该数据库是一个用于多目标追踪和多目标计数的数据库,其中包含数个摄像头下的行人图像序列。DukeMTMC-reID 数据集的目的是提供一个用于行人重识别算法研究和评估的标准基准。 DukeMTMC-reID 数据集包含8个身份标注的行人图像序列,其中有拍摄角度变化和遮挡等挑战因素。这些序列分为训练集和测试集,训练集包含16,522个图像,测试集包含19,842个图像。每个图像都有相应的标签,表示图像所属的行人身份。 除了行人图像序列,DukeMTMC-reID 数据集还提供了行人图像的边界框注释和行人测距注释,这些注释可以用于算法的性能评估和验证。 使用DukeMTMC-reID 数据集进行行人重识别算法的研究和评估,可以帮助改进行人重识别算法的性能。该数据集的挑战在于拍摄角度变化、遮挡和尺度变化等现实场景中常见的问题,因此对于算法的鲁棒性和准确性提出了更高的要求。 总之,DukeMTMC-reID 数据集是一个用于行人重识别算法研究和评估的标准基准,提供了具有挑战性的行人图像序列以及相应的标签和注释,对于改进行人重识别算法的性能具有重要意义。 ### 回答3: DukeMTMC-reID数据集是一个用于行人重识别(reID)研究的数据集。它由杜克大学多个监控摄像头拍摄的8个监控摄像头中的行人图像组成,这些图像涵盖多个场景和条件。数据集中包含了16,522个行人身份的2,228,339张图像,使其成为一个非常大规模的reID数据集。 这个数据集的特点之一是它的复杂性和挑战性。由于摄像头的不同视角、拍摄距离、光照条件和行人之间的遮挡,行人的外观可能在不同的图像中有很大的差异。此外,数据集中还存在一些行人的重复出现,也就是同一个行人在不同的时间和地点出现了多次,这增加了重识别任务的难度。鉴于这些挑战,使用DukeMTMC-reID数据集进行reID研究可以更好地模拟实际监控场景中的情况。 该数据集还提供了行人的标注框和行人身份的标签,使研究人员能够使用这些信息进行模型训练和性能评估。此外,数据集还提供了用于训练和测试集划分的预定义分组,以及用于评估reID性能的指标,如CMC曲线和mAP。 DukeMTMC-reID数据集已经在行人重识别算法的研究中得到了广泛的应用。通过使用该数据集,研究人员可以开发和评估各种reID方法的性能,以提升行人重识别的效果。此外,该数据集还可以用于其他目标检测、行人跟踪和行为识别等相关研究领域。总之,DukeMTMC-reID数据集是一个有价值且挑战性的资源,为行人重识别研究提供了良好的基础。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

KingsMan666

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值