ImageNet2012分类数据集下载和处理

Y木公

已于 2025-04-01 03:29:25 修改

阅读量811

点赞数 3

文章标签：分类人工智能数据挖掘

于 2025-03-31 20:19:00 首次发布

本文链接：https://blog.csdn.net/weixin_45777855/article/details/146882508

版权

下载

官网：ImageNet

百度网盘： https://pan.baidu.com/s/1Tmh9-XWUvDwexf-00P5IyQ?pwd=c86x 提取码: c86x

官网需要教育邮箱注册登录才能下载，而且下载速度很慢。建议使用百度网盘链接

下载后会得到下面三个压缩包

ILSVRC2012_devkit_t12.tar.gz：工具包
ILSVRC2012_img_train.tar：训练集，140G
ILSVRC2012_img_val.tar：验证集，6.4G

处理

调用官方的方法进行处理

from torchvision.datasets.imagenet import parse_devkit_archive, parse_train_archive, parse_val_archive

root = "/path/to/folder/of/archives"
parse_devkit_archive(root)
parse_train_archive(root)
parse_val_archive(root)

使用这段代码需要将root路径设为三个压缩包的根目录，运行上面的代码，会自动根据工具包中的信息编织数据。其中train压缩包需要先解压。

tar -xvf /root/autodl-tmp/datasets/ImageNet2012/ILSVRC2012_img_train.tar -C /root/autodl-tmp/datasets/ImageNet2012/

最终得到如下的文件结构：

/imagenet/
        |----train
              |----n01440764
              |----...
        |----val
              |----n01440764
              |----...

使用

import torchvision
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# 定义数据变换
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# 加载训练集
train_dataset = datasets.ImageNet(root='/path/to/imagenet', split='train', transform=transform)

# 创建数据加载器
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)

# 迭代数据集
for inputs, labels in train_loader:
    print(inputs.shape)  # 打印输入图像的形状
    print(labels.shape)  # 打印标签的形状
    break  # 仅迭代一次，查看数据的输出