1. 行人属性数据集PA100K介绍
PA-100K数据集是迄今为止用于行人属性识别的最大数据集,其中包含从室外监控摄像头收集的总共100000张行人图像,每张图像都有26个常用属性。根据官方设置,整个数据集随机分为80000个训练图像、10000个验证图像和10000个测试图像。
博主将该数据集放到了百度云盘中,https://pan.baidu.com/s/1sOg6S3QU8NucfFj5SF50qg 提取码:lh02,请按照需求下载。
2. 行人数据解析
从百度云下载数据后,发现标注信息是annotation.mat的标注文件,不好直观感受其标注信息。
那么,下面就将annotation.mat解析处理,转化为我们熟悉的格式。转化代码如下:
import pandas as pd
import scipy
from scipy import io
data = scipy.io.loadmat('annotation.mat')
def mat2txt(data, key):
subdata = data[key]
dfdata = pd.DataFrame(subdata)
dfdata.to_csv("%s.txt" % key, index=False)
if __name__ == "__main__":
data = scipy.io.loadmat("annotation.mat")
key_list = ["attributes", "test_images_name", "test_label",
"train_images_name", "train_label",
"val_images_name", "val_label"]
for key in key_list:
mat2txt(data, key)
运行代码后,就把annotation.mat文件转化为几个.txt的文件。如下图所示:
用查看attributes.txt test_images_name.txt test_label.txt 里面的内容如下(我用vim打开的):
如何训练行人属性模型,请参考:基于fastreid训练行人属性模型
推荐一个很好的行人属性训练工程:https://blog.csdn.net/Guo_Python/article/details/113735260
OK,有了这些数据,你就可以进行行人属性识别研究了。
另外一个公开数据集介绍PEAT:https://blog.csdn.net/hyk_1996/article/details/80322026
如需技术交流,请留言或微信: