ImageNet ISLVRC2012数据集下载和使用

最近要在imagenet数据集上做实验,以前只知道这个数据集很大,但是没用过,这次亲自下载然后按照训练集和验证集划分好了,记录一下。

主要参考了这个 https://zhuanlan.zhihu.com/p/370799616

1. 数据集下载

数据集官网:https://www.image-net.org/challenges/LSVRC/index.php
目前实验一般都用ILSVRC 2012,下载需要用学生邮箱注册,之后能进到下载界面
https://image-net.org/challenges/LSVRC/2012/2012-downloads.php
在这里插入图片描述
如果是图像识别任务的话,下载这两个就可以了。
放上链接:
Training images (Task 1 & 2)
Validation images (all tasks)

正常下载的话应该是非常慢,而且由于数据集很大,容易中断,建议科学上网。
这里有个磁力链接,亲测可用:https://hyper.ai/datasets/4889

2. 数据集处理

已经下载了两个数据集,一个是训练集,一个是验证集,现在就要把这数据集整理成可以供模型直接加载的形式。

2.1 训练集

首先解压 ILSVRC2012_img_train.tar到train,里边包含1000个小的tar压缩包,每一个对应一类的图片(压缩包的名称就代表这一类,不要修改),所以再将他们都解压成文件夹就好了。

先解压
mkdir train
tar xvf ILSVRC2012_img_train.tar -C ./train

因为数量多,写个脚本 touch unzip.sh

#!/bin/bash
dir=./train 
for x in `ls $dir/*tar`
do	
  filename=`basename $x .tar`     
  mkdir $dir/$filename     
  tar -xvf $x -C $dir/$filename 
done 
rm *.tar

添加可执行权限,执行一下
chmod +x ./unzip.sh
./unzip.sh

由于压缩包ILSVRC2012_img_train.tar比较大,处理后可以删除了。可以直接把train.tar先移动到train中,再进行操作。

最终训练集形式:
在这里插入图片描述

2.2 验证集

验证集比较简单,只有50000张图片,直接解压 ILSVRC2012_img_val.tar就可以。但是为了后续的使用,也需要把这些图片分成1000类(创建1000个文件夹,把对应类的图片放进去,与训练集结构保持一致)。

先解压
mkdir val
tar xvf ILSVRC2012_img_val.tar -C ./val

分类的过程可以借助官网中给的development kit中的 data/ILSVRC2012_validation_ground_truth.txt 和 data/meta.mat 进行划分,但是需要自己写脚本,比较麻烦,所以这里用个现成的脚本,直接处理一下就行。

进入val,下载脚本,执行
cd val
wget -qO- https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh
chmod +x ./valprep.sh
./valprep.sh
rm valprep.sh

最终验证集形式:
在这里插入图片描述

3. 数据集加载

数据集处理后格式:

-imagenet
	-train
	-val

使用pytorch进行数据集加载

封装数据加载模块

# data_loader.py
import os
import torch
import torchvision.transforms as transforms
import torchvision.datasets as datasets

def data_loader(root, batch_size=256, workers=1, pin_memory=True):
    traindir = os.path.join(root, 'train')
    valdir = os.path.join(root, 'val')
    normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                     std=[0.229, 0.224, 0.225])

    train_dataset = datasets.ImageFolder(
        traindir,
        transforms.Compose([
            transforms.RandomResizedCrop(224),
            transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            normalize
        ])
    )
    val_dataset = datasets.ImageFolder(
        valdir,
        transforms.Compose([
            transforms.Resize(256),
            transforms.CenterCrop(224),
            transforms.ToTensor(),
            normalize
        ])
    )
    
    train_loader = torch.utils.data.DataLoader(
        train_dataset,
        batch_size=batch_size,
        shuffle=True,
        num_workers=workers,
        pin_memory=pin_memory,
        sampler=None
    )
    val_loader = torch.utils.data.DataLoader(
        val_dataset,
        batch_size=batch_size,
        shuffle=False,
        num_workers=workers,
        pin_memory=pin_memory
    )
    return train_loader, val_loader

主程序调用

# Data loading
from data_loader import data_loader	

def main():
	...
	# args.data = './imagenet'
    train_loader, val_loader = data_loader(args.data, args.batch_size, args.workers, args.pin_memory)
    ...
  • 19
    点赞
  • 60
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
### 回答1: Imagenet-1k是一个常用的大规模图片数据集,其中包含来自1000个类别的超过一百万张高分辨率图片。如果你想要下载Imagenet-1k数据集,可以按照以下步骤进行: 1. 获得授权:首先,你需要获得相应的授权才能下载Imagenet-1k数据集。你可以访问Imagenet的官方网站并申请一个账号,然后根据指导完成授权过程。 2. 下载工具:一旦获得授权,可以下载相应的数据集下载工具,例如ImageNet Downloader或ImageNet Download.py。可以在GitHub等网站上找到这些工具的开源代码。 3. 安装工具:根据下载工具的说明,将其安装到你的计算机上。这通常需要一些命令行操作和软件依赖项的安装。 4. 数据集下载:完成工具的安装后,你可以使用命令行界面启动工具,并输入相应的命令来下载Imagenet-1k数据集。根据数据集的大小和你的网络连接速度,下载过程可能需要一些时间。 5. 解压数据:一旦下载完成,你将得到一个压缩文件,包含所有的Imagenet-1k图片。使用压缩软件将其解压到你选择的目录中。 6. 准备数据:解压后,你可以按照你的需求进行数据的处理和准备。这可能涉及到对图片进行预处理、划分数据集、生成标签等操作。 总之,下载Imagenet-1k数据集需要申请授权、下载相应的工具、安装工具、使用工具下载数据集、解压数据集,最后进行数据的处理和准备。这些步骤需要一些技术知识和时间,但是下载完整的Imagenet-1k数据集可以为你的研究和实验提供丰富的图像数据资源。 ### 回答2: 要下载Imagenet-1k数据集,可以按照以下步骤进行操作。 1. 获取数据集访问权限:Imagenet是一个庞大的图像数据库,用于图像识别和分类任务。首先,你需要申请访问权限。访问Imagenet官方网站,并填写相关的表格并提交申请。 2. 设置开发环境:你需要确保你的计算机上已安装Python等必要的开发环境。Python是一种流行的编程语言,用于获取和处理数据。你还需要安装TensorFlow或者PyTorch等深度学习框架,以便进行图像处理和训练模型。 3. 使用API下载数据集:一旦你收到了访问权限,你可以使用Imagenet提供的API下载数据集。这个API可以让你通过命令行或者Python代码来下载特定类别的图像数据。 4. 解压和处理数据:一旦下载完成,你需要解压缩数据集文件。然后你可以使用Python代码来处理和准备数据,以便用于模型训练。这可能包括图像预处理、数据拆分和标签处理等步骤。 5. 开始训练模型:一旦你准备好了数据,你可以使用深度学习框架来训练模型。你可以选择使用预训练模型作为基础,也可以从头开始训练一个新的模型。 总之,下载Imagenet-1k数据集需要先申请访问权限,然后使用API下载并解压数据集。接下来,你可以使用Python代码和深度学习框架来处理数据和训练模型。这是进行图像识别和分类研究所必需的数据集之一。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值