为了使机器更智能,开发人员正在研究机器学习和深度学习技术。人类通过反复练习和重复执行任务来学习执行任务,从而记住了如何执行任务。然后,他大脑中的神经元会自动触发,它们可以快速执行所学的任务。深度学习与此也非常相似。它针对不同类型的问题使用不同类型的神经网络体系结构。对象识别,图像和声音分类,对象检测,图像分割等。
什么是手写数字识别?
手写数字识别是计算机识别人类手写数字的能力。对于机器而言,这是一项艰巨的任务,因为手写数字不是完美的,可以用多种方法。手写数字识别是使用数字图像并识别图像中存在的数字的解决方案。
在本文中,我们将使用MNIST数据集实现一个手写数字识别应用程序。我们将使用一种特殊类型的深度神经网络,即
卷积神经网络
。最后,我们将构建一个GUI,您可以在其中绘制数字并立即识别它。
在这里我们使用Keras库和Tkinter库进行深度学习以构建GUI。
MNIST数据集
这可能是机器学习和深度学习爱好者中最受欢迎的数据集之一。该MNIST数据集包含的手写数字从0到9 60000个训练图像和10,000张进行测试。因此,MNIST数据集具有10个不同的类。手写数字图像表示为28×28矩阵,其中每个单元格都包含灰度像素值。
步骤如下:
1、导入库并加载数据集
首先,我们将导入训练模型所需的所有模块。Keras库已经包含一些数据集,而MNIST是其中之一。因此,我们可以轻松导入数据集并开始使用它。该
mnist.load_data()
方法返回训练数据,它的标签,也是测试数据和标签。
import keras
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras import backend as K
# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()
print(x_train.shape, y_train.shape)
2、