Keras分类问题数据集fashion-minist
在学习使用tensorflow的过程中,对于分类问题来说必不可少的就是fashion_minist数据集,导入过程如下:
import tensorflow as tf
from tensorflow import keras
#导入fashion_minist数据集
fashion_mnist = keras.datasets.fashion_mnist
出现错误
由于第一次导入需要从Google资源库中拉取fashion-mnist的数据集,博主网络出现了问题,直接退出之后重新开始下载数据集,再次下载之后出现了如下的错误提示:
EOFError: Compressed file ended before the end-of-stream marker was reached
原因是所下载文件已经存在或下载了部分,若是重新下载,这会出现上述错误提示。所以我们需要把下载了一半的包删除,问题便可以解决。
解决步骤
博主用的是macbook, 因此在这里列出macOS的解决方法:
- 打开终端,进入数据集下载所在目录
cd ~/.keras/datasets
ls
命令查看 datasets 目录下的文件,可以看到有fashion-mnist
目录cd fashion-mnist/
进入fashion-mnist目录下可以看到存在4个未下载完成的文件:
t10k-images-idx3-ubyte.gz
train-images-idx3-ubyte.gz
t10k-labels-idx1-ubyte.gz
train-labels-idx1-ubyte.gzcd ..
直接退回上一级目录rm -rf fashion-mnist/
删除整个fashion-mnist文件夹- 再次运行,便可重新下载
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
32768/29515 [=================================] - 1s 35us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
26427392/26421880 [==============================] - 106s 4us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
8192/5148 [===============================================] - 0s 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
4423680/4422102 [==============================] - 6s 1us/step
其他方法
如果大家因为网络问题无法实时下载数据集,可以在Github上下载,然后通过本地导入的方式将数据集导入至~/.keras/datasets
目录下
链接: Github fashion-mnist数据集下载.