关于fashion_mnist数据集离线加载的问题

关于fashion_mnist数据集离线加载的问题


一名正在利用Python学习机器学习的新手,随笔记录。
在使用fashion_mnist数据集的时候,出现一个问题:由于数据集全部都是.gz文件。将数据集下载到本地后,不知怎样才能将数据集在jupyter notebook里加载。
(fashion_mnist在github的文档说可以用mnist_reader来做,但自己并不能尝试成功 )
因此,在网上搜索方法许久后,找到了一位博主的做法,亲测有效:

博主页面原文

具体代码如下:

def load_data(data_folder): # data_folder为保存的文件夹目录
    files = [
        'train-labels-idx1-ubyte.gz','train-images-idx3-ubyte.gz',
        't10k-labels-idx1-ubyte.gz','t10k-images-idx3-ubyte.gz'
    ]
    paths = []
    for fname in files:
        paths.append(os.path.join(data_folder,fname))
        
    with gzip.open(paths[0],'rb') as lbpath:
        y_train = np.frombuffer(lbpath.read(),np.uint8,offset=8)
        
    with gzip.open(paths[1],'rb') as imgpath:
        X_train = np.frombuffer(imgpath.read(),np.uint8,offset=16).reshape(len(y_train),28,28)
    
    with gzip.open(paths[2],'rb') as lbpath:
        y_test = np.frombuffer(lbpath.read(),np.uint8,offset=8)
        
    with gzip.open(paths[3],'rb') as imgpath:
        X_test = np.frombuffer(imgpath.read(),np.uint8,offset=16).reshape(len(y_test),28,28)
    return (X_train,y_train),(X_test,y_test)

(train_images,train_labels),(test_images,test_labels) = load_data('./data\\fashion\\')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值