机器学习实战——使用K-近邻算法识别手写数字

最新推荐文章于 2021-10-10 23:08:07 发布

kelvinLLL

最新推荐文章于 2021-10-10 23:08:07 发布

阅读量1k

点赞数

分类专栏： python 机器学习实战文章标签：机器学习 python KNN 手写识别

本文链接：https://blog.csdn.net/kelvinLLL/article/details/65953006

版权

本文介绍了使用K-近邻（KNN）算法进行手写数字识别的过程。通过将32x32像素的手写数字文本文件转化为一维数组，结合从文件名提取的标签信息，训练并实现了一个识别系统。实验结果显示错误率为1.8%，但KNN算法存在计算量大、速度慢以及存储需求高的问题，这取决于K值和训练样本数量的选择。

摘要由CSDN通过智能技术生成

使用K-近邻分类器构造手写识别系统，手写数字图片已经经过处理成为文本文件，如下所示：

每张图片都是32像素X32像素

首先，我们要把每个输入的文本文件转换KNN算法（前面的KNN算法实践已经有了，这里就不贴了）可以处理的格式，即一维数组的形式，定义以下函数：

def img2vector(filename):
    """
    将32x32的图像转化为1x1024的向量
    :param filename:
    :return:
    """
    return_vect = zeros((1, 1024))
    fr = open(filename)
    for i in range(32):              # 用for line in readlines()也可以
        line_str = fr.readline()      # 一行一行的读
        for j in range(32):
            return_vect[0, 32*i+j] = int(line_str[j])
    fr.close()
    return return_vect

有了上面的函数，就可以设计循环，把训练集，测试集，标