行人属性数据集PA100K下载并解析

最新推荐文章于 2024-08-12 08:54:40 发布

CV-deeplearning

最新推荐文章于 2024-08-12 08:54:40 发布

阅读量5.7k

点赞数 7

分类专栏：数据集文章标签：行人属性 PA100K 行人属性数据集人工智能

本文链接：https://blog.csdn.net/Guo_Python/article/details/113541430

版权

数据集专栏收录该内容

9 篇文章 3 订阅

订阅专栏

1. 行人属性数据集PA100K介绍

PA-100K数据集是迄今为止用于行人属性识别的最大数据集，其中包含从室外监控摄像头收集的总共100000张行人图像，每张图像都有26个常用属性。根据官方设置，整个数据集随机分为80000个训练图像、10000个验证图像和10000个测试图像。

博主将该数据集放到了百度云盘中，https://pan.baidu.com/s/1sOg6S3QU8NucfFj5SF50qg 提取码:lh02，请按照需求下载。

2. 行人数据解析

从百度云下载数据后，发现标注信息是annotation.mat的标注文件，不好直观感受其标注信息。

那么，下面就将annotation.mat解析处理，转化为我们熟悉的格式。转化代码如下：

import pandas as pd
import scipy
from scipy import io

data = scipy.io.loadmat('annotation.mat')

def mat2txt(data, key):
    subdata = data[key]
    dfdata = pd.DataFrame(subdata)
    dfdata.to_csv("%s.txt" % key, index=False)

if __name__ == "__main__":
    data = scipy.io.loadmat("annotation.mat")
    key_list = ["attributes", "test_images_name", "test_label",
                "train_images_name", "train_label",
                "val_images_name", "val_label"]
    for key in key_list:
        mat2txt(data, key)

运行代码后，就把annotation.mat文件转化为几个.txt的文件。如下图所示：