基于TensorFlow2.1.0的简单CNN实现手写体MNIST数据集识别

最新推荐文章于 2021-05-19 09:10:58 发布

九久呀

最新推荐文章于 2021-05-19 09:10:58 发布

阅读量1.2k

点赞数 2

分类专栏： python学习深度学习入门与进阶

本文链接：https://blog.csdn.net/qq_38851184/article/details/105141157

版权

深度学习入门与进阶同时被 2 个专栏收录

48 篇文章 1 订阅

订阅专栏

python学习

35 篇文章 0 订阅

订阅专栏

文章目录

实验环境：
识别流程

实验环境：

操作系统：win10，64位处理器
处理器：Intel Corei5
内存：16GB
编辑工具： Jupyter Notebook
所有框架：tensorflow2.1.0 下的keras框架
如果没有安装keras，可以打开命令提示符，使用pip install keras即可。

识别流程

读入数据集
数据进行归一化处理、标签进行独热编码处理
使用顺序网络模型
搭建输入层、隐藏层、输出层
训练模型

下图是我训练的结果。
在这里插入图片描述
代码如下：

import numpy as np
from keras.datasets import mnist
from keras.utils import np_utils
from keras.models import Sequential
from keras.layers import Dense,Dropout,Convolution2D,MaxPooling2D,Flatten 
#二维卷积、二维最大池化、扁平化(二维->一维)
from keras.optimizers import Adam   # 优化器

上面是导入所需要的的包，下面是主要的代码

#载入数据集
(train_data,train_label),(test_data,test_label) = mnist.load_data()
#(60000, 28, 28)------->(60000, 784)  转化数据格式(扁平化)
train_data = train_data.reshape(-1,28,28,1)/255.0  #除以255是做归一化 1表示图像深度
test_data = test_data.reshape(-1,28,28,1)/255.0   #-1会自动进行匹配，也可以写60000
#将标签转化为one hot编码,
#one hot会将每一个标签用唯一的形式进行表示
train_label = np_utils.to_categorical(train_label,num_classes=10)
test_label = np_utils.to_categorical(test_label,num_classes=10)


#创建模型，输入784个神经元，输出10个神经元
model = Sequential()

# 第一个卷积层
# input_shape输入平面
# kernel——size 卷积窗口大小
# padding padding方法 same or valid
# activation 激活函数
model.add(Convolution2D(
    input_shape = (28,28,1),
    filters = 32,   #32个特征图
    kernel_size = 5,   # 卷积窗口大小为5
    strides = 1,       # 步长为1
    padding = 'same',    # 用same padding ，得到的图片与输入的图片大小是一样的
    activation = 'relu'
))
# 第一个池化层
model.add(MaxPooling2D(   
    pool_size = 2,
    strides = 2,    # 出来的特征图为14*14大小
    padding = 'same', 
))

#第二个卷积层 64个滤波器（卷积核），卷积窗口大小为5*5
#经过第二个卷积层后，有64个特征图，每个特征图为14*14
model.add(Convolution2D(64,5,strides = 1, padding='same',activation='relu'))

# 第二个池化层，经过第二个池化层以后，得到的图大小为7*7
model.add(MaxPooling2D(2,2,'same'))  

# 把第二个池化层的输出扁平化为1维 64*7*7
model.add(Flatten())

# 第一个全连接层 
model.add(Dense(1024,activation = 'relu')) 
#Dropout
model.add(Dropout(0.5))

#第二个全连接层，由于是输出层，所以使用softmax做激活函数
model.add(Dense(10,activation='softmax'))

#定义优化器
adam = Adam(lr=0.001)
# 优化器，loss function，训练过程中的准确率
model.compile(optimizer = adam,
              loss='categorical_crossentropy',
              metrics=['accuracy']
             )
#开始训练
model.fit(train_data,train_label,batch_size=32,epochs=10)

#评估模型
loss,accuracy = model.evaluate(test_data,test_label)

print('\ntest loss: ',loss)
print('\naccuracy',accuracy)

九久呀

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于TensorFlow2.1.0的简单CNN实现手写体MNIST数据集识别

文章目录实验环境：识别流程实验环境：操作系统：win10，64位处理器处理器：Intel Corei5内存：16GB编辑工具： Jupyter Notebook所有框架：tensorflow2.1.0 下的keras框架如果没有安装keras，可以打开命令提示符，使用pip install keras即可。识别流程读入数据集数据进行归一化处理、标签进行独热编码处理使用顺序网...
复制链接

扫一扫