Python 深度学习--学习笔记（五）-CSDN博客

本文链接：https://blog.csdn.net/yuan_1520/article/details/97481090

用CNN编写手写数字识别

今天，我们来用卷积神经网络来编写手写数字识别。
我们先来说说全连接层（密集连接层）和卷积层在学习上的根本区别：由于给全连接层传入的是二维数组，Dense层从输入特征空间中学到的是全局模式，而传给卷积层的是三维形式，通过卷积核的运算特性，学到的是局部模式。

我们先来构建模型：

from keras import layers
from keras import models

model = models.Sequential()
model.add(layers.Conv2D(32,(3,3), activation='relu', input_shape=(28,28,1)))
#input_shape = (image_height, image_width, image_channels)
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))

此时输入层为Conv层，input_shape为一个三维数组（mnist图片为28像素长 * 28像素高 1个通道（黑白图片））

Conv层默认卷积核为 2 * 2 ，stride 为 1，pad 为 0.
Maxpooling2D层为2 * 2 stride为2.

最后展平再经过密集层，最后输出10个概率数。

输入：

model.summary()

可查看经过每层后输出的形状，以及需要的参数大小：

处理数据：

from keras.datasets import mnist

(train_images,train_labels),(test_images,test_labels) = mnist.load_data()

train_images = train_images.reshape((60000,28,28,1))
test_images = test_images.reshape((10000,28,28,1))
#调整图片

train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255
#处理成灰度图像

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
#标签与输出一致

编译，训练模型：

model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['acc'])

model.fit(train_images,train_labels,epochs=5,batch_size=64)

输出：

最后，评估模型：

test_loss,test_acc = model.evaluate(test_images,test_labels)
print(test_acc)

输出：
10000/10000 [==============================] - 1s 79us/step
0.9926