deepsort训练market1501数据集

最新推荐文章于 2025-04-22 14:11:01 发布

凤酱

最新推荐文章于 2025-04-22 14:11:01 发布

阅读量5.1k

点赞数 3

文章标签：计算机视觉深度学习人工智能

本文链接：https://blog.csdn.net/weixin_45459097/article/details/126819099

版权

该博客介绍了Market-1501行人重识别数据集的详细信息，包括数据集的结构、命名规则和划分方法。作者提供了批量处理代码，用于图像重命名、尺寸调整和训练集与测试集的划分。之后，对YOLOv5的train.py和model.py进行了相应的配置修改，如调整图像尺寸、学习率和类别数。最后，给出了训练的步骤和参数设置。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.market1501数据集简介

Market-1501 数据集在清华大学校园中采集，夏天拍摄，在 2015 年构建并公开。它包括由6个摄像头（其中5个高清摄像头和1个低清摄像头）拍摄到的 1501 个行人、32668 个检测到的行人矩形框。每个行人至少由2个摄像头捕获到，并且在一个摄像头中可能具有多张图像。训练集有 751 人，包含 12,936 张图像，平均每个人有 17.2 张训练数据；测试集有 750 人，包含 19,732 张图像，平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的，而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。

1.1目录结构

1） “bounding_box_test”——用于测试集的 750 人，包含 19,732 张图像，前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图（可能与query是同一个人），-1 表示检测出来其他人的图（不在这 750 人中）
2） “bounding_box_train”——用于训练集的 751 人，包含 12,936 张图像
3） “query”——为 750 人在每个摄像头中随机选择一张图像作为query，因此一个人的query最多有 6 个，共有 3,368 张图像
4） “gt_query”——matlab格式，用于判断一个query的哪些图片是好的匹配（同一个人不同摄像头的图像）和不好的匹配（同一个人同一个摄像头的图像或非同一个人的图像）
5） “gt_bbox”——手工标注的bounding box，用于判断DPM检测的bounding box是不是一个好的box

1.2命名规则
以 0001_c1s1_000151_01.jpg 为例
1） 0001 表示每个人的标签编号，从0001到1501；
2） c1 表示第一个摄像头(camera1)，共有6个摄像头；
3） s1 表示第一个录像片段(sequece1)，每个摄像机都有数个录像段；
4） 000151 表示 c1s1 的第000151帧图片，视频帧率25fps；
5） 01 表示 c1s1_001051 这一帧上的第1个检测框，由于采用DPM检测器，对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框

2.数据集划分

由于有1501个行人，因此需要划分成1501个文件夹，每个文件夹下放同一个人的图片，用前751个行人的文件夹做训练集，后750个行人的文件夹做测试集。

2.1划分数据的代码

import os
from PIL import Image
from shutil import copyfile, copytree, rmtree, move
 
PATH_DATASET = '/home/zqy/Desktop/yolov5-master/nxm_data/crops'  # 需要处理的文件夹
PATH_NEW_DATASET = '/home/zqy/Desktop/