python3 27.keras使用卷积神经网络(CNN)对MNIST数据集进行分类学习笔记

最新推荐文章于 2024-06-15 17:55:22 发布

mcyJacky

最新推荐文章于 2024-06-15 17:55:22 发布

阅读量4k

点赞数 1

分类专栏： 05 深度学习之计算机视觉CV笔记文章标签： keras 卷积神经网络 CNN LeNet-5 MNIST分类

本文链接：https://blog.csdn.net/mcyJacky/article/details/88706087

版权

05 深度学习之计算机视觉CV笔记专栏收录该内容

34 篇文章 1 订阅

订阅专栏

文章目录

- 前言

前言

计算机视觉系列之学习笔记主要是本人进行学习人工智能（计算机视觉方向）的代码整理。本系列所有代码是用python3编写，在平台Anaconda中运行实现，在使用代码时，默认你已经安装相关的python库，这方面不做多余的说明。本系列所涉及的所有代码和资料可在我的github上下载到，gitbub地址：https://github.com/mcyJacky/DeepLearning-CV，如有问题，欢迎指出。

在关于图像处理等神经网络中，卷积神经网络（Convolutional neural network）是一种常用的方式，具体卷积使用过程中的原理本篇不做详细的介绍。与传统BP神经网络相比，CNN的优势有：

参数共享 parameter sharing
稀疏连接 sparsity of connections

图1.1 卷积操作示例

如图1.1所示，输入图为：32x32x3，通过卷积操作后输出图：28x28x6。则共有计算参数有卷积核参数5*5 = 25个，偏置参数为1个，共有6个卷积核则共有参数(25+1)*6 = 156个参数。而如果输入和输出是传统BP网络，则共有参数约32x32x3 x 28x28x6 ≈14000000个。可以看出使用CNN可以有效的减少神经网络训练需要的参数个数。

LeNet-5模型是非常经典的CNN网络，它的网络结构图如下图2.1所示：

图2.1 LeNet-5网络结构

该网络的输入为32x32x1结构，然后进行卷积-平均池化-卷积-平均池化-全连接-全连接-softmax输出。MNIST数据集的输入为28x28x1结构，下面通过tensorflow建立CNN网络对MNIST数据集分类(该网络与LeNet-5不完全一样):

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense, Dropout, Convolution2D, MaxPooling2D, Flatten
from keras.optimizers import Adam

# 载入数据
(x_train,y_train), (x_test,y_test) = mnist.load_data()

# (6000,28,28)
print('x_shape:', x_train.shape)
# (6000)
print('y_shape:', y_train.shape)

# 进行数据转换,并归一化
# (60000,28,28) -> (60000, 28, 28, 1)
x_train = x_train.reshape(-1, 28, 28, 1)/255.0
x_test = x_test.reshape(-1, 28, 28, 1)/255.0
# 换one hot格式
y_train = np_utils.to_categorical(y_train, num_classes=10)
y_test = np_utils.to_categorical(y_test, num_classes=10)

# 定义顺序模型
model = Sequential()

# 第一个卷积层
# input_shape 输入平面
# filters 卷积核/滤波器个数
# kernel_size 卷积窗口大小
# strides 步长
# padding padding方式 same/valid
# activation 激活函数
model.add(Convolution2D(
        input_shape=(28,28,1), 
        filters=32, 
        kernel_size=5,
        strides=1, 
        padding='same', 
        activation='relu',
    ))

# 第一个池化层
model.add(MaxPooling2D(
        pool_size=2, 
        strides=2, 
        padding='same',
    ))

# 第二个卷积层
model.add(Convolution2D(64, 5, strides=1, padding='same', activation='relu'))
# 第二个池化层
model.add(MaxPooling2D(2, 2, 'same'))

# 把第二个池化层的输出扁平化
model.add(Flatten())
# 第一个全连接层
model.add(Dense(1024, activation='relu'))
# Dropout
model.add(Dropout(0.5))

# 第二个全连接层
model.add(Dense(10, activation='softmax'))

# 定义优化器
adam = Adam(lr=1e-4)
# 定义优化器，loss function, 训练过程中的准确率
model.compile(optimizer=adam, loss='categorical_crossentropy', metrics=['accuracy'])

# 训练模型
model.fit(x_train, y_train, batch_size=64, epochs=10)

# 评估模型
loss, accuracy = model.evaluate(x_test,y_test)

print('test loss: ', loss)
print('test accuracy: ', accuracy)
# 输出结果：
# x_shape: (60000, 28, 28)
# y_shape: (60000,)
# Epoch 1/10
# 60000/60000 [==============================] - 214s 4ms/step - loss: 0.3343 - acc: 0.9043
# Epoch 2/10
# 60000/60000 [==============================] - 214s 4ms/step - loss: 0.0887 - acc: 0.9729
# Epoch 3/10
# 60000/60000 [==============================] - 214s 4ms/step - loss: 0.0635 - acc: 0.9806
# Epoch 4/10
# 60000/60000 [==============================] - 214s 4ms/step - loss: 0.0493 - acc: 0.9848
# Epoch 5/10
# 60000/60000 [==============================] - 214s 4ms/step - loss: 0.0414 - acc: 0.9873
# Epoch 6/10
# 60000/60000 [==============================] - 225s 4ms/step - loss: 0.0357 - acc: 0.9888
# Epoch 7/10
# 60000/60000 [==============================] - 211s 4ms/step - loss: 0.0299 - acc: 0.9908
# Epoch 8/10
# 60000/60000 [==============================] - 210s 3ms/step - loss: 0.0270 - acc: 0.9913
# Epoch 9/10
# 60000/60000 [==============================] - 211s 4ms/step - loss: 0.0239 - acc: 0.9924
# Epoch 10/10
# 60000/60000 [==============================] - 205s 3ms/step - loss: 0.0206 - acc: 0.9933
# 10000/10000 [==============================] - 12s 1ms/step
# test loss:  0.021567985947515262
# test accuracy:  0.9922

通过训练结果可知，使用CNN对MNIST数据集分类的效果比BP神经网络要好很多，准确率已经高于99%。LeNet-5网络模型也是一个比较简单的CNN模型，以后会介绍更多深度卷积经典网络。

【参考】：
   1. 城市数据团课程《AI工程师》计算机视觉方向
   2. deeplearning.ai 吴恩达《深度学习工程师》
   3. 《机器学习》作者：周志华
   4. 《深度学习》作者：Ian Goodfellow

转载声明：
版权声明：非商用自由转载-保持署名-注明出处
署名：mcyJacky
文章出处：https://blog.csdn.net/mcyJacky

mcyJacky

关注

1
点赞
踩
30

收藏

觉得还不错? 一键收藏
2
评论
python3 27.keras使用卷积神经网络(CNN)对MNIST数据集进行分类学习笔记

文章目录前言前言     计算机视觉系列之学习笔记主要是本人进行学习人工智能（计算机视觉方向）的代码整理。本系列所有代码是用python3编写，在平台Anaconda中运行实现，在使用代码时，默认你已经安装相关的python库，这方面不做多余的说明。本系列所涉及的所有代码和资料可在我的github上下载到，gitbub地址：https://github....
复制链接

扫一扫