Keras入门级实战——MNIST手写体识别

手写体识别:

这里要解决的问题是,将手写数字的灰度图像(28 像素×28 像素)划分到 10 个类别 中(0 ~ 9)。这个数据集包含 60 000 张训练图像和 10 000 张测试图 像,由美国国家标准与技术研究院(National Institute of Standards and Technology,即 MNIST 中 的 NIST)在 20 世纪 80 年代收集得到。图 2 - 1 给出了 MNIST 数据集的 一 些样本。

一、加载Keras中MNIST数据集

# 下面是输入数据。
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

train_images 和 train_labels 组成了训练集(training set),模型将从这些数据中进行 学习。然后在测试集(test set,即 test_images 和 test_labels)上对模型进行测试。 图像被编码为 Numpy 数组,而标签是数字数组,取值范围为 0 ~ 9。图像和标签 一一 对应。

我们来看 一 下训练数据:

下面是测试数据:

接下来的工作流程如下:

首先,将训练数据(train_images 和 train_labels)输入神 经网络;

其次,网络学习将图像和标签关联在 一 起;

最后,网络对 test_images 生成预测, 而我们将验证这些预测与 test_labels 中的标签是否匹配。

二、下面我们来构建网络。

from keras import models
from keras import layers
network = models.Sequential()
network.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
network.add(layers.Dense(10, activation='softmax'))

神经网络的核心组件是层(layer),它是 一 种数据处理模块,你可以将它看成数据过滤器。 进去 一 些数据,出来的数据变得更加有用。具体来说,层从输入数据中提取表示 —— 我们期望 这种表示有助于解决手头的问题。大多数深度学习都是将简单的层链接起来,从而实现渐进式 的数据蒸馏(data distillation)。深度学习模型就像是数据处理的筛子,包含 一 系列越来越精细的 数据过滤器(即层)。

本例中的网络包含 2 个 Dense 层,它们是密集连接(也叫全连接)的神经层。第二层(也 是最后 一 层)是 一 个 10 路 softmax 层,它将返回 一 个由 10 个概率值(总和为 1)组成的数组。 每个概率值表示当前数字图像属于 10 个数字类别中某 一 个的概率。

要想训练网络,我们还需要选择编译(compile)步骤的三个参数。

损失函数(loss function):网络如何衡量在训练数据上的性能,即网络如何朝着正确的 方向前进。

优化器(optimizer):基于训练数据和损失函数来更新网络的机制。

在训练和测试过程中需要监控的指标(metric):本例只关心精度,即正确分类的图像所 占的比例。 后续两章会详细

三、编译步骤

network.compile(optimizer='rmsprop',
                loss='categorical_crossentropy',
                metrics=['accuracy'])

在开始训练之前,我们将对数据进行预处理,将其变换为网络要求的形状,并缩放到所 有值都在 [0, 1] 区间。比如,之前训练图像保存在 一 个 uint8 类型的数组中,其形状为 (60000, 28, 28),取值区间为 [0, 255]。我们需要将其变换为 一 个 float32 数组,其形 状为 (60000, 28 * 28),取值范围为 0 ~ 1。

四、准备图像数据

train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype('float32') / 255
test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

我们还需要对标签进行分类编码:

from keras.utils import to_categorical
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

五、现在我们准备开始训练网络,在 Keras 中这 一 步是通过调用网络的 fit 方法来完成的 —— 我们在训练数据上拟合(fit)模型。

 network.fit(train_images, train_labels, epochs=5, batch_size=128)

训练过程:

六、检查模型在测试集上的性能

test_loss, test_acc = network.evaluate(test_images, test_labels)

测试集精度为97.8%,比训练集精度低不少。这种差距是过拟合造成的。

后期会同步更上不同模型框架在手写体识别上的应用。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值