利用KNN算法实现手写数字识别

最新推荐文章于 2024-08-14 11:57:07 发布

人的身体第一

最新推荐文章于 2024-08-14 11:57:07 发布

阅读量216

点赞数 5

文章标签：算法机器学习深度学习

本文链接：https://blog.csdn.net/m0_74270120/article/details/138198834

版权

一、数据准备与展示

首先，我们需要准备一份包含手写数字图像和对应标签的数据集。我们使用了一个CSV文件，其中每行包含一个手写数字的图像数据和对应的标签。

为了查看数据集的一些基本信息和图像，我们定义了一个名为show1的函数。该函数接受一个索引作为参数，并显示该索引对应的手写数字图像以及数据集的类别分布。通过调用show1(8)，我们可以查看第8个手写数字的图像。

二、模型训练

接下来，我们定义了一个名为train_model的函数来训练KNN模型。在该函数中，我们首先读取CSV文件中的数据，并对图像数据进行归一化处理。归一化是将图像数据的像素值缩放到0到1之间，有助于提升模型的性能。

然后，我们使用train_test_split函数将数据集分割为训练集和测试集。这里，我们指定测试集的大小为数据集的20%，并使用stratify参数确保训练集和测试集中各类别的比例与原数据集相同。

接下来，我们创建一个KNN分类器对象，并使用训练数据对其进行训练。在KNN算法中，我们选择邻居的数量为2。训练完成后，我们使用测试集对模型进行评估，计算测试集上的准确率。

最后，我们使用joblib库将训练好的模型保存到磁盘上，以便后续使用。

三、模型测试

为了测试模型的性能，我们定义了一个名为test_model的函数。在该函数中，我们首先读取一张手写数字图像，并使用joblib库加载之前保存的KNN模型。

然后，我们将图像数据重塑为模型输入所需的格式，并使用模型对图像进行预测。最后，我们打印出预测结果，即模型识别的手写数字。

完整代码如下：


from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import joblib
from collections import Counter
import pandas as pd
import matplotlib.pyplot as plt
from skimage import transform
def show1(idx):
  data = pd.read_csv(r'D:\Users\wang\Desktop\手写数字识别.csv')
  if idx < 0 or idx > len(data) - 1:
    return
  x = data.iloc[:, 1:]
  y = data.iloc[:, 0]
  print('数据基本信息:', x.shape)
  print('类别数据比例:', Counter(y))
  print('当前数字的标签为:', y[idx])
  data_ = x.iloc[idx].values
  data_ = data_.reshape(28, 28)
  plt.axis('off')
  plt.imshow(data_, cmap='gray')
  plt.show()
show1(8)
#
def train_model():
 data = pd.read_csv(r'D:\Users\wang\Desktop\手写数字识别.csv')
 # 2 数据预处理 归一化
 x = data.iloc[:, 1:] / 255
 y = data.iloc[:, 0]
 # 3 分割数据集
 split_data = train_test_split(x, y, test_size=0.2, stratify=y, random_state=22)
 x_train, x_test, y_train, y_test = split_data
 # 4 模型训练
 estimator = KNeighborsClassifier(n_neighbors=2)
 estimator.fit(x_train, y_train)
 # 5 模型评估
 acc = estimator.score(x_test, y_test)
 print('测试集准确率: %.2f' % acc)
 # 6 模型保存
 joblib.dump(estimator, 'model/knn.pth')
def test_model():
# 1 读取图片数据
 img = plt.imread(r'D:\Users\wang\Desktop\Figure_1.png')
 plt.imshow(img)
# 2 加载模型
 knn = joblib.load('model/knn.pth')
# 3 预测图片
 y_pred = knn.predict(img.reshape(1, -1))
 print('您绘制的数字是:', y_pred)
print(train_model())
print(test_model())

结果如下：

人的身体第一

关注

5
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
利用KNN算法实现手写数字识别

接下来，我们创建一个KNN分类器对象，并使用训练数据对其进行训练。训练完成后，我们使用测试集对模型进行评估，计算测试集上的准确率。在该函数中，我们首先读取CSV文件中的数据，并对图像数据进行归一化处理。首先，我们需要准备一份包含手写数字图像和对应标签的数据集。我们使用了一个CSV文件，其中每行包含一个手写数字的图像数据和对应的标签。然后，我们将图像数据重塑为模型输入所需的格式，并使用模型对图像进行预测。最后，我们打印出预测结果，即模型识别的手写数字。这里，我们指定测试集的大小为数据集的20%，并使用。
复制链接

扫一扫