图像识别入门项目—识别手写数字
第一步:导入必要的库
sklearn**
全称scikit-learn是一个机器学习库,有一些算法
第二步:加载数据集
mnist数据集
是nist数据集的一个子集,mnist数据集可以在这个网站获取http://yann.lecun.com/exdb/mnist/,主要有下面这几个文件:
文件内容:总共有6万个测试图像,1万个测试图像,图片标签
- train-images-idx3-ubyte.gz 包含55000张训练集图片,5000张验证集图片
- train-labels-idx1-ubyte.gz 训练集标签
- t10k-images-idx3-ubyte.gz 10000张测试集
- t10k-labels-idx1-ubyte.gz 测试集对应标签
第三步:数据预处理
其中:x_train 保存用来训练的图像,y_train 是与之对应的标签。假设图像中的数字是1,那么标签就是1。
x_test 和 y_test 分别为用来验证的图像和标签,也就是验证集。训练完神经网络后,可以使用验证集中的数据进行验证。
第四步:创建神经网络
MLPClassifier
mlp分类器是sklearn库中的一个分类器,它在多层神经网络中应用了反向传播算法,以训练可用于分类任务的模型。
第五步:训练
训练是使用的mlp分类器的内置算法训练的
第六步:验证集验证
第七步:验证一张图片
结果:
备注:这个图像是手写数字图片压缩成8*8像素后的