官网: http://pascal.inrialpes.fr/data/human/
下载地址: ftp://ftp.inrialpes.fr/pub/lear/douze/data/INRIAPerson.tar
INRIA 数据集是一组有标记的站立或行走的人的图像,是 Navneet Dalal 在图像和视频中检测直立的行人的研究工作中收集的。该研究详见 Dalal 的博士毕业论文以及 Dalal 2005 2005 2005 年在 CVPR 上发表的一篇论文——“Histograms of Oriented Gradients for Human Detection”,也是在这篇论文中 Dalal 和 Triggs 提出了 HOG+SVM 行人检测算法。
INRIA 数据集中训练集有正样本 614 614 614 张(包含 1237 1237 1237 个行人),负样本 1218 1218 1218 张;测试集有正样本 288 288 288 张(包含 589 589 589 个行人),负样本 453 453 453 张。图片中人体大部分为站立姿势且高度大于 100 100 100 个象素,部分标注可能不正确。图片主要来源于 GRAZ-01、个人照片及 google,因此图片的清晰度较高。
对于下载的文件(INRIAPerson.tar),由于用到了软连接,在 Windows 上直接解压会有问题,使用 WSL(Windows Subsystem for Linux) 可以解决,解压命令:
tar xvf INRIAPerson.tar
具体地,下载下来的 INRIA 数据集内有6个文件夹:
‘./Train’ 和 ‘./Test’ 文件夹分别对应于原始训练图像和测试图像。这两个文件夹的每个文件夹内都有三个子文件夹: /pos(正样本图像)、/neg(负样本图像)、/annotations(Pascal Challenge格式的正样本的注释文件)。
文件夹 ‘./train_64x128_H96’ 和 ‘./test_64x128_H96’ 对应于标准化(标准化的意思是图像有相同的分辨率)的数据集。两个文件夹中都有子文件夹:/pos、/neg。‘/pos’ 文件夹中的图像实际为根目录下 ‘/96X160H96’ 和 ‘/70X134H96’ 文件夹下的图片,是以人为中心左右镜像的标准化正训练或测试图像,使用的是软连接,‘/neg’ 文件夹也是如此,实际上是原始图像 ‘./Train/neg’ 和 ‘./Test/neg’ 中的图像。所以根目录下虽然有六个文件夹,但是实际上只有四个文件夹有图像。
数据集文件夹 Tree 目录及每个目录图像数目如下所示:
- ./INRIAPerson
- /Train – 1832
- /Test – 741
- /train_64x128_H96
- /pos – 2416
- /neg – 1218
- /test_64x128_H96
- /pos – 1126
- /neg – 453