有需要的人,请在评论区留下你的邮箱。
本人,双非学校小硕。研究方向行人重识别。收集了一些常用数据集。
Market-1501-v15.09.15
dukemtmc-reid
顺便附上一个根据相机id划分数据集的代码
import os
import shutil
import os.path as osp
import numpy as np
import glob
import re
from collections import defaultdict
from tqdm import tqdm
def _process_dir(dir_path, relabel=False):
img_paths = glob.glob(osp.join(dir_path, '*.jpg')) # 把此文件夹下的以jpg结尾的文件路径获取
pattern = re.compile(r'([-\d]+)_c(\d)')
# 将源pid构建一个映射,得到新的对应标签
pid_container = set() # 定义集合。重复数据会被删除,同时会排序
for img_path in img_paths:
pid, _ = map(int, pattern.search(img_path).groups()) # 只有两段都是数字。map映射
if pid == -1: continue # 有一些辣鸡数据
pid_container.add(pid)
pid2label = {
pid: label for label, pid in enumerate(pid_container)}
# 将数据打包成元组,进行储存
dataset = []
for img_path in img_paths:
pid, camid = map(int, pattern.search(img_path).groups())
if pid == -1: continue
#assert 0 <= pid <= 1501
assert 1 <= camid <= 8
camid -= 1
if relabel: pid = pid2label[pid]
dataset.append((img_path, pid, camid))
num_pids = len(pid_container)
num_imgs = len(