MNIST数据集
MNIST是手写数据图片数据集,包含0~9十种数字,每种数字7000张图片,6000作为训练集,1000作为测试集,一共是70000张数字图片。
每张图片是28*28的矩阵,每个矩阵元素有一个值,处于[0~255]之间,0代表白色,255代表黑色,代表灰色的深浅程度。
下面就是加载MNIST数据集和数据的初始化过程:
有以下三个问题需要关注:
为什么需要数据的归一化?
- 数值差异问题。如果一个变量远远大于另一个变量,那么这个变量的变化可能引起函数值的变化远远大于另一个变量引起函数值的变化。因此这个变量的变化会掩盖另一个变量带来的变化,使得函数最值对应的另一个变量的位置极难搜索,造成收敛速度