[转] 使用 Keras 搭建深度学习网络做手写数字识别

最新推荐文章于 2022-02-11 15:47:36 发布

Vincent_Chu

最新推荐文章于 2022-02-11 15:47:36 发布

阅读量561

点赞数

一. 如何理解 CNN 网络中的卷积作用

CNN 的网络结构由三种层组成，它们分别是卷积层、池化层和全连接层。卷积层相当于滤镜的作用，它可以把图像分块，对每一块的图像进行卷积操作。

假设有一个二维的图像 X 和卷积 K，把二维矩阵 X 进行卷积 K 操作之后，可以得到矩阵 Z，如下图所示：

它的计算原理如下:

第一步，需要将卷积核翻转 180 度（只有翻转之后才能做矩阵运算），也就是变成：

第二步，将卷积核的第一个元素，对准矩阵 X 左上角的第一个元素，对应元素相乘，然后再相加可以就可以得到 10*1+10*1+10*0+10*1+5*0+5*-1+10*0+5*-1+5*-1=15:

第三步，每个元素都重复第二步的计算过程，可以得到如下的矩阵结果 Z：

这样就完成了一个卷积的操作。

二. 用 Keras 做 Mnist 手写数字识别

相关代码:

# -*- coding:utf-8 -*-
# 使用 LeNet 模型对 Mnist 手写数字进行识别
import keras
from keras.datasets import mnist
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Dense, Flatten
from keras.models import Sequential

# 数据加载
(train_x, train_y), (test_x, test_y) = mnist.load_data()
# 输入数据为 mnist 数据集
train_x = train_x.reshape(train_x.shape[0], 28, 28, 1)
test_x = test_x.reshape(test_x.shape[0], 28, 28, 1)
train_x = train_x / 255
test_x = test_x / 255
train_y = keras.utils.to_categorical(train_y, 10)
test_y = keras.utils.to_categorical(test_y, 10)
# 创建序贯模型
model = Sequential()
# 第一层卷积层：6 个卷积核，大小为 5∗5, relu 激活函数
model.add(Conv2D(6, kernel_size=(5, 5), activation='relu', input_shape=(28, 28, 1)))
# 第二层池化层：最大池化
model.add(MaxPooling2D(pool_size=(2, 2)))
# 第三层卷积层：16 个卷积核，大小为 5*5，relu 激活函数
model.add(Conv2D(16, kernel_size=(5, 5), activation='relu'))
# 第二层池化层：最大池化
model.add(MaxPooling2D(pool_size=(2, 2)))
# 将参数进行扁平化，在 LeNet5 中称之为卷积层，实际上这一层是一维向量，和全连接层一样
model.add(Flatten())
model.add(Dense(120, activation='relu'))
# 全连接层，输出节点个数为 84 个
model.add(Dense(84, activation='relu'))
# 输出层 用 softmax 激活函数计算分类概率
model.add(Dense(10, activation='softmax'))
# 设置损失函数和优化器配置
model.compile(loss=keras.metrics.categorical_crossentropy, optimizer=keras.optimizers.Adam(), metrics=['accuracy'])
# 传入训练数据进行训练
model.fit(train_x, train_y, batch_size=128, epochs=2, verbose=1, validation_data=(test_x, test_y))
# 对结果进行评估
score = model.evaluate(test_x, test_y)
print('误差:%0.4lf' % score[0])
print('准确率:', score[1])

输出结果:

误差:0.0699 准确率: 0.9776

Vincent_Chu

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
[转] 使用 Keras 搭建深度学习网络做手写数字识别

一. 如何理解 CNN 网络中的卷积作用 CNN 的网络结构由三种层组成，它们分别是卷积层、池化层和全连接层。卷积层相当于滤镜的作用，它可以把图像分块，对每一块的图像进行卷积操作。假设有一个二维的图像 X 和卷积 K，把二维矩阵 X 进行卷积 K 操作之后，可以得到矩阵 Z，如下图所示：它的计算原理如下: 第一步，需要将卷积核翻转 180 度（只有翻...
复制链接

扫一扫