torchvision.datasets.MNIST(root, train=True, transform=None, target_transform=None, download=False)
参数说明: - root : processed/training.pt
和 processed/test.pt
的主目录
- train : True
= 训练集, False
= 测试集
- download : True
= 从互联网上下载数据集,并把数据集放在root
目录下. 如果数据集之前下载过,将处理过的数据(minist.py中有相关函数)放在processed
文件夹下
由于使用torchvision下载数据集是使用的外网,所以可能会出现数据集下载不了或下载速度慢的情况。 解决方案:只能提前下载数据集。 那么如何使用已下载数据集呢? |
查看该函数的源代码(按住ctrl,然后点击相应的函数)如下图:
然后把源代码中的网址替换成本地的文件地址就可以了,如下所示:
替换
urls = [
'http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz',
'http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz',
'http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz',
'http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz',
]
成为
urls = [
'file:///home/jankin/dataset/mnist/train-images-idx3-ubyte.gz',
'file:///home/jankin/dataset/mnist/train-labels-idx1-ubyte.gz',
'file:///home/jankin/dataset/mnist/t10k-images-idx3-ubyte.gz',
'file:///home/jankin/dataset/mnist/t10k-labels-idx1-ubyte.gz',
]