Pytorch从本地获取数据集

Pytorch从本地获取数据集

  • 在学习pytorch的过程中需要从MNIST获取数据集,然而下载是让人头疼的事,从网上寻找数据资源比较便捷
  • 获取到的数据如何在pytorch中加载呢

1 下载数据集

2. 从本地进行数据加载

  • 获取测试集与训练集

    直接运行后,发现依旧是下载数据,那我本地的数据集怎么才能被加载

    mnist_train = torchvision.datasets.FashionMNIST(root='./MNIST', train=True, download=True,transform=transforms.ToTensor())
    mnist_test = torchvision.datasets.FashionMNIST(root='./MNIST', train=False, download=True,transform=transforms.ToTensor())
  
  • 查找数据源url

按下Ctrl,左键点击FashionMNIS,进入mnist.py,在resources下可以看到,这里是数据集的下载路径,需要将其修改为本地文件的路径

在这里插入图片描述

  • 查找本地数据源
    在这里插入图片描述

  • 将本地数据源替换之前的路径

特别要注意后面的None,这个是md5校验码,如果不填会报错

在这里插入图片描述

  • 运行程序,加载数据集

        mnist_train = torchvision.datasets.FashionMNIST(root='./MNIST', train=True, download=True,transform=transforms.ToTensor())
        mnist_test = torchvision.datasets.FashionMNIST(root='./MNIST', train=False, download=True,transform=transforms.ToTensor())
        print(type(mnist_train))
        print(len(mnist_train), len(mnist_test))
    

在这里插入图片描述
完成

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
下面是一个使用PyTorch加载本地CIFAR数据集的代码示例: ```python import torch from torchvision import datasets, transforms # 数据预处理的转换 transform = transforms.Compose([ transforms.ToTensor(), transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5]) ]) # CIFAR-10数据集的根目录 data_dir = './cifar_data' # 加载训练集和测试集 train_dataset = datasets.CIFAR10(root=data_dir, train=True, download=False, transform=transform) test_dataset = datasets.CIFAR10(root=data_dir, train=False, download=False, transform=transform) # 创建数据加载器 train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True) test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=64, shuffle=False) # 可以使用train_loader和test_loader来迭代获取数据 for images, labels in train_loader: # 在这里进行训练数据的处理 pass for images, labels in test_loader: # 在这里进行测试数据的处理 pass ``` 上述代码中,首先定义了数据预处理的转换,将图像转换为张量并进行归一化。然后指定了CIFAR-10数据集的根目录,这个目录应该包含名为`train`和`test`的子文件夹,分别存放训练集和测试集的图像文件。接下来使用`datasets.CIFAR10`类加载训练集和测试集,指定数据集的根目录、训练集/测试集、是否下载以及数据预处理转换。最后使用`torch.utils.data.DataLoader`创建数据加载器,指定数据集和批次大小。 请确保将`data_dir`变量设置为正确的CIFAR-10数据集的根目录路径,并确保数据集已经下载到该路径下。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangxiaobei2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值