神经网络的学习——获取MNIST

关于MNIST数据集:

1、由受人尊敬的神经网络研究员Yann LeCun的网站可以得到原始格式的MNIST手写数据集参见:MNIST数据库(1.0)

2、由于上述的MNIST数据库的格式不容易使用,因此其他人创建了相对简单的数据文件格式,参见:MNIST数据库(2.0)
这些文件称为CSV文件,这意味着纯文本中的每一个值都是由逗号分隔的,我们可以轻松地在任何文本编辑器中查看这些数值,大部分的电子表格和数据分析软件也兼容CSV文件。
在此网页下,可下载测试集 train set 和训练集 test set 这两个CSV文件.

用excel打开:
在这里插入图片描述
用文本编辑器打开:
在这里插入图片描述
第一列的值是标签,即书写者实际希望表示的数字,如“5”“0”或者“7”“2”等,这是我们希望神经网络学习得到的正确答案。
(每一行共785个值,编辑器自动换行了,例如,用文本编辑器打开测试集,第一列的第一个值是7,第二个值是2……)

为什么每一行除标签外剩下的共有784个数字?是因为,后面的值,是手写体数字的像素值,像素数组的尺寸是28X28,因此在标签后有784个值。

3、MNIST数据的数据文件是相当大的,因此在深入研究之前,我们应该下载MNIST数据集中的一个较小的子集。较小的字体意味着我们可以实验、尝试和开发代码,而不会由于大量的数据集而拖慢计算机的速度。一旦确定了乐于使用的算法和代码,我们就可以使用完整的数据集。

以下是MNIST数据集中较小子集的链接,也是以CSV格式存储的:
MNIST测试数据集中的10条记录和训练数据集中的100条记录——参见:https://github.com/makeyourownneuralnetwork/makeyourownneuralnetwork/tree/master/mnist_dataset

《Python神经网络编程》一书的学习

全书详解了代码的来源,除此之外,还提供了一些数据可供学习:

完整代码详见:Python实现神经网络

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值