利用pytorch的datasets在本地读取MNIST数据集

最新推荐文章于 2024-07-22 16:21:02 发布

Nefu_lyh

最新推荐文章于 2024-07-22 16:21:02 发布

阅读量5.7k

点赞数 11

分类专栏：安装、调试问题文章标签：深度学习

本文链接：https://blog.csdn.net/qq_46126258/article/details/114017614

版权

安装、调试问题专栏收录该内容

9 篇文章 14 订阅

订阅专栏

文章目录

1、问题描述

想利用datasets.MNIST直接加载数据集，但是！太慢了！开了VPN从外网下载依然慢！我就从别的地方下载了MNIST数据集到本地，打算直接加载使用。原始代码如下：

transform = transforms.Compose([
    transforms.ToTensor(),  # 转变为1×28×28的tensor
    transforms.Normalize((0.1307,), (0.3081,))  # 控制像素值在[0,1]
])
batch_size = 64
train_dataset = datasets.MNIST(root='E:/datasets_download/dataset/mnist/',
                               train=True, download=True,
                               transform=transform
)
train_loader = DataLoader(train_dataset,
                          batch_size=batch_size,
                          shuffle=True)
test_dataset = datasets.MNIST(root='E:/datasets_download/dataset/mnist/',
                              train=False,
                              download=True,
                              transform=transform
                              )
test_loader = DataLoader(test_dataset,
                         batch_size=batch_size,
                         shuffle=True
                         )

但直接像下面那样把参数改为download=False是不可行的

datasets.MNIST(root='E:/datasets_download/dataset/mnist/',
                               train=True, download=True,
                               transform=transform
)

因为在mnist.py文件中的MNIST类的下载链接还是外网，那我把链接直接改成我的本地不就行了？按照这个博主的链接操作我失败了，报了一堆错误，最后也没解决我自己的问题。（可能每个人的情况不一样吧）
在这里插入图片描述

2、解决办法

运行程序下载失败后，在我的路径下产生了MNIST文件夹，里面包含processed和raw文件夹，raw文件夹里有下载失败但已经存在的文件。如下：
在这里插入图片描述
将原来下载失败的文件删除，再把已经下载好的四个文件移到这个raw文件夹下，在运行程序就会自动扫描大约2min，数据集就加载成功了。

3、原理解释

当第一次运行下载失败后，文件会被储存下来而不会消失。所以在下一次运行程序进行下载时，已经下载过的部分不会再次下载而被覆盖，而是对已经下载的部分进行扫描，判断接下来应该下载哪一部分。

利用这个原理，我把已经下载好的MNIST数据集替代他未下载完成的部分，让她“误以为”这是之前下载好的，从而只进行扫描不再进行下载。

以上纯属个人理解，希望对各位有所帮助╰(￣▽￣)╭。

Nefu_lyh

关注

11
点赞
踩
13

收藏

觉得还不错? 一键收藏
8
评论
利用pytorch的datasets在本地读取MNIST数据集

文章目录1、问题描述2、解决办法3、原理解释1、问题描述想利用datasets.MNIST直接加载数据集，但是！太慢了！开了VPN从外网下载依然慢！我就从别的地方下载了MNIST数据集到本地，打算直接加载使用。原始代码如下：transform = transforms.Compose([ transforms.ToTensor(), # 转变为1×28×28的tensor transforms.Normalize((0.1307,), (0.3081,)) # 控制像素值在[0,1
复制链接

扫一扫

专栏目录