MNIST数据集介绍

大多数示例使用手写数字的MNIST数据集[^1]。该数据集包含60,000个用于训练的示例和10,000个用于测试的示例。这些数字已经过尺寸标准化并位于图像中心,图像是固定大小(28x28像素),其值为0到1。为简单起见,每个图像都被平展并转换为784(28 * 28)个特征的一维numpy数组。

概览

用法

在我们的示例中,我们使用TensorFlow input_data.py脚本来加载该数据集。

它对于管理我们的数据非常有用,并且可以处理:

  • 加载数据集
  • 将整个数据集加载到numpy数组中
# 导入 MNIST
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

# 加载数据
X_train = mnist.train.images
Y_train = mnist.train.labels
X_test = mnist.test.images
Y_test = mnist.test.labels

  • next_batch函数,可以遍历整个数据集并仅返回所需的数据集样本部分(以节省内存并避免加载整个数据集)。
# 获取接下来的64个图像数组和标签
batch_X, batch_Y = mnist.train.next_batch(64)   

[^1]: http://yann.lecun.com/exdb/mnist/

欢迎关注磐创博客资源汇总站:http://docs.panchuang.net/

欢迎关注PyTorch官方中文教程站:http://pytorch.panchuang.net/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值