用CNN编写手写数字识别
用全连接网络便携手写数字识别在Python 深度学习–学习笔记(一)
今天,我们来用卷积神经网络来编写手写数字识别。
我们先来说说全连接层(密集连接层)和卷积层在学习上的根本区别:由于给全连接层传入的是二维数组,Dense层从输入特征空间中学到的是全局模式,而传给卷积层的是三维形式,通过卷积核的运算特性,学到的是局部模式。
我们先来构建模型:
from keras import layers
from keras import models
model = models.Sequential()
model.add(layers.Conv2D(32,(3,3), activation='relu', input_shape=(28,28,1)))
#input_shape = (image_height, image_width, image_channels)
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.MaxPooling2D((2,2)))
model.add(layers.Conv2D(64,(3,3),activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(10,activation='softmax'))
此时输入层为Conv层,input_shape为一个三维数组(mnist图片为28像素长 * 28像素高 1个通道(黑白图片))
Conv层默认卷积核为 2 * 2 ,stride 为 1,pad 为 0.
Maxpooling2D层为2 * 2 stride为2.
最后展平再经过密集层,最后输出10个概率数。
输入:
model.summary()
可查看经过每层后输出的形状,以及需要的参数大小:
处理数据:
from keras.datasets import mnist
(train_images,train_labels),(test_images,test_labels) = mnist.load_data()
train_images = train_images.reshape((60000,28,28,1))
test_images = test_images.reshape((10000,28,28,1))
#调整图片
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255
#处理成灰度图像
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)
#标签与输出一致
编译,训练模型:
model.compile(optimizer='rmsprop',
loss='categorical_crossentropy',
metrics=['acc'])
model.fit(train_images,train_labels,epochs=5,batch_size=64)
输出:
最后,评估模型:
test_loss,test_acc = model.evaluate(test_images,test_labels)
print(test_acc)
输出:
10000/10000 [==============================] - 1s 79us/step
0.9926