利用KNN算法实现手写数字识别

一、数据准备与展示

首先,我们需要准备一份包含手写数字图像和对应标签的数据集。我们使用了一个CSV文件,其中每行包含一个手写数字的图像数据和对应的标签。

为了查看数据集的一些基本信息和图像,我们定义了一个名为show1的函数。该函数接受一个索引作为参数,并显示该索引对应的手写数字图像以及数据集的类别分布。通过调用show1(8),我们可以查看第8个手写数字的图像。

二、模型训练

接下来,我们定义了一个名为train_model的函数来训练KNN模型。在该函数中,我们首先读取CSV文件中的数据,并对图像数据进行归一化处理。归一化是将图像数据的像素值缩放到0到1之间,有助于提升模型的性能。

然后,我们使用train_test_split函数将数据集分割为训练集和测试集。这里,我们指定测试集的大小为数据集的20%,并使用stratify参数确保训练集和测试集中各类别的比例与原数据集相同。

接下来,我们创建一个KNN分类器对象,并使用训练数据对其进行训练。在KNN算法中,我们选择邻居的数量为2。训练完成后,我们使用测试集对模型进行评估,计算测试集上的准确率。

最后,我们使用joblib库将训练好的模型保存到磁盘上,以便后续使用。

三、模型测试

为了测试模型的性能,我们定义了一个名为test_model的函数。在该函数中,我们首先读取一张手写数字图像,并使用joblib库加载之前保存的KNN模型。

然后,我们将图像数据重塑为模型输入所需的格式,并使用模型对图像进行预测。最后,我们打印出预测结果,即模型识别的手写数字。

完整代码如下:


from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import joblib
from collections import Counter
import pandas as pd
import matplotlib.pyplot as plt
from skimage import transform
def show1(idx):
  data = pd.read_csv(r'D:\Users\wang\Desktop\手写数字识别.csv')
  if idx < 0 or idx > len(data) - 1:
    return
  x = data.iloc[:, 1:]
  y = data.iloc[:, 0]
  print('数据基本信息:', x.shape)
  print('类别数据比例:', Counter(y))
  print('当前数字的标签为:', y[idx])
  data_ = x.iloc[idx].values
  data_ = data_.reshape(28, 28)
  plt.axis('off')
  plt.imshow(data_, cmap='gray')
  plt.show()
show1(8)
#
def train_model():
 data = pd.read_csv(r'D:\Users\wang\Desktop\手写数字识别.csv')
 # 2 数据预处理 归一化
 x = data.iloc[:, 1:] / 255
 y = data.iloc[:, 0]
 # 3 分割数据集
 split_data = train_test_split(x, y, test_size=0.2, stratify=y, random_state=22)
 x_train, x_test, y_train, y_test = split_data
 # 4 模型训练
 estimator = KNeighborsClassifier(n_neighbors=2)
 estimator.fit(x_train, y_train)
 # 5 模型评估
 acc = estimator.score(x_test, y_test)
 print('测试集准确率: %.2f' % acc)
 # 6 模型保存
 joblib.dump(estimator, 'model/knn.pth')
def test_model():
# 1 读取图片数据
 img = plt.imread(r'D:\Users\wang\Desktop\Figure_1.png')
 plt.imshow(img)
# 2 加载模型
 knn = joblib.load('model/knn.pth')
# 3 预测图片
 y_pred = knn.predict(img.reshape(1, -1))
 print('您绘制的数字是:', y_pred)
print(train_model())
print(test_model())

结果如下:

  • 5
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值