手动MNIST数据集

这篇博客介绍了如何手动下载MNIST数据集,该数据集包含60000个训练样本和10000个测试样本,主要用于深度学习和模式识别的练习。MNIST数据集的数字经过标准化和居中处理,方便进行预处理和格式化工作。
摘要由CSDN通过智能技术生成

DOWNLOAD THE MNIST DATABASE

MNIST数据集有60000个示例的训练集和10000个示例的测试集。它是NIST提供的更大集合的子集。数字已经过大小标准化,并在固定大小的图像中居中。它是一个很好的数据库,为那些想尝试学习技术和模式识别方法的人对现实世界的数据,同时花费最小的努力在预处理和格式化。

诶哟图丢了

Python 3.8.10

Package                 Version
----------------------- -------------------
tensorflow-gpu          2.5.0
# !/usr/bin/env python
# -*- coding: utf-8 -*-
import os, gzip, struct, PIL, numpy, random
import matplotlib.pyplot as pyp
import numpy.random as ran
"""
读取MNIST数据集。
"""


def read_mnist(root: str, noise=False):
    """读取整个MNIST数据集

    Args:
        root (str): MNIST数据集的`train-images-idx3-ubyte.gz`、`train-labels-idx1-ubyte.gz`、`t10k-images-idx3-ubyte.gz`、`t10k-labels-idx1-ubyte.gz`四个`.gz`文件所在目录。
        noise (bool, optional): 描述是否添加噪声. 默认`False`。

    Returns:
        tuple: 训练集图片、训练集标签、测试集图片、测试集标签、图片尺寸。
    """
    TRAIN_X_FILENAME = 'train-images-idx3-ubyte.gz'  # 训练集图片
    TRAIN_Y_FILENAME = 'train-labels-idx1-ubyte.gz'  # 训练集标签
    TEST_X_FILENAME = 't10k-images-idx3-ubyte.gz'  # 测试集图片
    TEST_Y_FILENAME = 't10k-labels-idx1-ubyte.gz'  # 测试集标签
    STEP = 4  # 4个字节一起读取
    MODE = &#
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值