ImageNet 2012 数据集的下载与处理
ImageNet的介绍
ImageNet数据集是一个计算机视觉数据集,是由斯坦福大学的李飞飞教授带领创建。该数据集包合 14,197,122张图片和21,841个Synset索引。 ImageNet数据集一直是评估图像分类算法性能的基准。
ImageNet数据集里总共有1000个类别。
ImageNet的下载
1、百度网盘链接:链接:链接: https://pan.baidu.com/s/1zYImC0YZZ4EXGOkITIyleg 提取码: fbn3
2、具体介绍
数据集包含1000类对象的图像。这些类别一一对应于WordNet中1000个synsets (同义词名词集)。
仅供分类和定位任务使用:
图片:
- 训练集 ILSVRC2012_img_train、
- 验证集 ILSVRC2012_img_val.tar、
- 测试集 ILSVRC2012_img_test.tar
类名 imagenet-classes.txt
ImageNet的处理(Linux)
1、对ILSVRC2012_img_train文件夹的处理
- 在当前文件夹中新建 train 文件夹,将当前文件夹中的压缩包复制到 train 文件中;
- 进入 train 文件夹中,解压压缩包并且删除;
- 解压之后得到多个压缩文件,继续解压,创建对应的文件夹来保存解压出来的图片。
- 处理命令如下
mkdir train
cp ./ILSVRC2012_img_train/*.tar ./train
cd train
find . -name "*.tar" | while read NAME ; do mkdir -p "${NAME%.tar}"; tar -xvf "${NAME}" -C "${NAME%.tar}"; rm -f "${NAME}"; done
cd ..
2、对ILSVRC2012_img_val.tar 的处理
分为两部分
-
- 在当前文件夹中新建 val 文件夹,将当前文件夹中的压缩包复制到 val 文件中;</