ImageNet_2014数据集下载与解压

  1. 前言
    最近在配OpenLongTailRecognition-OLTR代码用的ImageNet_2014,因为数据集较大的原因,导致下载和数据集配置一直被耽误,进度很满,故此记录,以背不时只用。

  2. 进入imageNet主页
    注: 需要注册账号,教育邮箱即可

  3. 点击download
    在这里插入图片描述

  4. 点击2014
    在这里插入图片描述

3.1 image部分包括DET datasetCLS-LOC dataset(见后面)
在这里插入图片描述

3.2 Bounding Boxes部分如下
在这里插入图片描述

  1. 继续3.1部分,下载ILSVRC2012作为ILSVRC2014CLS-LOC dataset
    在这里插入图片描述

  2. 下载后的目录结构

(simdeblur) xiu@xiu:~/Learning/datasets/ImageNet_2014/ILSVRC2014$ tree
.
├── Bounding Boxes
│   ├── CLS-LOC_dataset
│   │   ├── ILSVRC2012_bbox_train_v2.tar.gz
│   │   └── ILSVRC2012_bbox_val_v3.tgz
│   └── DET_dataset
│       ├── ILSVRC2013_DET_bbox_val.tgz
│       └── ILSVRC2014_DET_bbox_train.tgz
└── Images
    ├── CLS-LOC_dataset
    │   └── ILSVRC2012
    │       ├── Bounding Boxes
    │       │   ├── ILSVRC2012_bbox_test_dogs.zip
    │       │   ├── ILSVRC2012_bbox_train_dogs.tar.gz
    │       │   ├── ILSVRC2012_bbox_train_v2.tar.gz
    │       │   └── ILSVRC2012_bbox_val_v3.tgz
    │       └── Images
    │           ├── ILSVRC2012_img_test_v10102019.tar
    │           ├── ILSVRC2012_img_train_t3.tar
    │           ├── ILSVRC2012_img_train.tar
    │           └── ILSVRC2012_img_val.tar
    └── DET_dataset
        ├── ILSVRC2013_DET_test.tar
        ├── ILSVRC2013_DET_val.tar
        └── ILSVRC2014_DET_train.tar
  1. 解压
cd /home/xiu/Learning/datasets/ImageNet_2014
mkdir train && mkdir test && mkdir val

# 1. 解压 ILSVRC2014-Images-DET_dataset 的外部目录并移动数据
cd /home/xiu/Learning/datasets/ImageNet_2014/ILSVRC2014/Images/DET_dataset
# 训练集
tar -xf ILSVRC2014_DET_train.tar
mv -v ./ILSVRC2014_DET_train/* /home/xiu/Learning/datasets/ImageNet_2014/train
rmdir ./ILSVRC2014_DET_train
# 验证集
tar -xf ILSVRC2013_DET_val.tar
mv -v ./ILSVRC2013_DET_val/* /home/xiu/Learning/datasets/ImageNet_2014/val
rmdir ./ILSVRC2013_DET_val
# 测试集
tar -xf ILSVRC2013_DET_test.tar
# mv ./ILSVRC2013_DET_test/* /home/xiu/Learning/datasets/ImageNet_2014/test, 报错: bash: /usr/bin/mv: 参数列表过长, 这是由于该文件夹下全是图片,文件数量太多
bash mv.bash
# mv.bash 内容如下 -------------------------------------------------
#!/bin/bash
i=0
for file in ./ILSVRC2013_DET_test/*; do
    ((i++)) && ((i % 1000 == 0)) && echo "Batch $i"
    mv -v "$file" /home/xiu/Learning/datasets/ImageNet_2014/test
done
# -----------------------------------------------------------------
rmdir ./ILSVRC2013_DET_test

# 2. 解压 ILSVRC2014-Images-DET_dataset 的内部目录
# 准备一个 untar.bash, 在/home/xiu/Learning/datasets/ImageNet_2014目录下
# untar.bash 内容如下 -----------------------------------------------
#!/bin/bash
for file in *.tar; do
  tar -xf "$file"
done
# -----------------------------------------------------------------
# train里面全部都是压缩包
cd /home/xiu/Learning/datasets/ImageNet_2014/train
cp ../untar.bash ./
bash untar.bash
rm -v ./*.tar # 删除当前目录下的所有包括".tar"文件

# 3. 解压 ILSVRC2014-Images-CLS-LOC_dataset 的外部目录并移动数据
cd /home/xiu/Learning/datasets/ImageNet_2014/ILSVRC2014/Images/CLS-LOC_dataset/ILSVRC2012/Images
# 训练集
tar -xf ILSVRC2012_img_train.tar -C /home/xiu/Learning/datasets/ImageNet_2014/train
tar -xf ILSVRC2012_img_train_t3.tar -C /home/xiu/Learning/datasets/ImageNet_2014/train
# 验证集
tar -xf ILSVRC2012_img_val.tar -C /home/xiu/Learning/datasets/ImageNet_2014/val
# 测试集
tar -xf ILSVRC2012_img_test_v10102019.tar
# mv -v ./test/* /home/xiu/Learning/datasets/ImageNet_2014/test, 报错: bash: /usr/bin/mv: 参数列表过长, 这是由于该文件夹下全是图片,文件数量太多
bash mv.bash
# mv.bash 内容如下 -------------------------------------------------
#!/bin/bash
i=0
for file in ./test/*; do
    ((i++)) && ((i % 1000 == 0)) && echo "Batch $i"
    mv -v "$file" /home/xiu/Learning/datasets/ImageNet_2014/test
done
# -----------------------------------------------------------------
rmdir ./test

# 4. 解压ILSVRC2014-Images-CLS-LOC_dataset 的内部目录
# 准备一个 untar2.bash, 在/home/xiu/Learning/datasets/ImageNet_2014目录下
# untar2.bash 内容如下 -----------------------------------------------
#!/bin/bash
for file in *.tar; do
  # 提取不带扩展名的文件名
  dir_name=$(basename "$file" .tar)
  
  # 如果目录不存在,则创建一个新目录
  if [ ! -d "$dir_name" ]; then
    mkdir "$dir_name"
  fi
  
  # 解压文件到新目录中
  tar -xf "$file" -C "$dir_name"
done
# -----------------------------------------------------------------
# train里面全部都是压缩包
cd /home/xiu/Learning/datasets/ImageNet_2014/train
cp ../untar2.bash ./
bash untar2.bash
rm -v ./*.tar # 删除当前目录下的所有包括".tar"文件, 注意"2. 解压 ILSVRC2014-Images-DET_dataset 的内部目录"的最后一步不要忘了执行
  • 6
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Imagenet-1k是一个常用的大规模图片数据集,其中包含来自1000个类别的超过一百万张高分辨率图片。如果你想要下载Imagenet-1k数据集,可以按照以下步骤进行: 1. 获得授权:首先,你需要获得相应的授权才能下载Imagenet-1k数据集。你可以访问Imagenet的官方网站并申请一个账号,然后根据指导完成授权过程。 2. 下载工具:一旦获得授权,可以下载相应的数据集下载工具,例如ImageNet Downloader或ImageNet Download.py。可以在GitHub等网站上找到这些工具的开源代码。 3. 安装工具:根据下载工具的说明,将其安装到你的计算机上。这通常需要一些命令行操作和软件依赖项的安装。 4. 数据集下载:完成工具的安装后,你可以使用命令行界面启动工具,并输入相应的命令来下载Imagenet-1k数据集。根据数据集的大小和你的网络连接速度,下载过程可能需要一些时间。 5. 解压数据:一旦下载完成,你将得到一个压缩文件,包含所有的Imagenet-1k图片。使用压缩软件将其解压到你选择的目录中。 6. 准备数据:解压后,你可以按照你的需求进行数据的处理和准备。这可能涉及到对图片进行预处理、划分数据集、生成标签等操作。 总之,下载Imagenet-1k数据集需要申请授权、下载相应的工具、安装工具、使用工具下载数据集解压数据集,最后进行数据的处理和准备。这些步骤需要一些技术知识和时间,但是下载完整的Imagenet-1k数据集可以为你的研究和实验提供丰富的图像数据资源。 ### 回答2: 要下载Imagenet-1k数据集,可以按照以下步骤进行操作。 1. 获取数据集访问权限:Imagenet是一个庞大的图像数据库,用于图像识别和分类任务。首先,你需要申请访问权限。访问Imagenet官方网站,并填写相关的表格并提交申请。 2. 设置开发环境:你需要确保你的计算机上已安装Python等必要的开发环境。Python是一种流行的编程语言,用于获取和处理数据。你还需要安装TensorFlow或者PyTorch等深度学习框架,以便进行图像处理和训练模型。 3. 使用API下载数据集:一旦你收到了访问权限,你可以使用Imagenet提供的API下载数据集。这个API可以让你通过命令行或者Python代码来下载特定类别的图像数据。 4. 解压和处理数据:一旦下载完成,你需要解压数据集文件。然后你可以使用Python代码来处理和准备数据,以便用于模型训练。这可能包括图像预处理、数据拆分和标签处理等步骤。 5. 开始训练模型:一旦你准备好了数据,你可以使用深度学习框架来训练模型。你可以选择使用预训练模型作为基础,也可以从头开始训练一个新的模型。 总之,下载Imagenet-1k数据集需要先申请访问权限,然后使用API下载解压数据集。接下来,你可以使用Python代码和深度学习框架来处理数据和训练模型。这是进行图像识别和分类研究所必需的数据集之一。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值