机器学习实战——使用K-近邻算法识别手写数字

本文介绍了使用K-近邻(KNN)算法进行手写数字识别的过程。通过将32x32像素的手写数字文本文件转化为一维数组,结合从文件名提取的标签信息,训练并实现了一个识别系统。实验结果显示错误率为1.8%,但KNN算法存在计算量大、速度慢以及存储需求高的问题,这取决于K值和训练样本数量的选择。
摘要由CSDN通过智能技术生成

使用K-近邻分类器构造手写识别系统,手写数字图片已经经过处理成为文本文件,如下所示:


每张图片都是32像素X32像素

首先,我们要把每个输入的文本文件转换KNN算法(前面的KNN算法实践已经有了,这里就不贴了)可以处理的格式,即一维数组的形式,定义以下函数:

def img2vector(filename):
    """
    将32x32的图像转化为1x1024的向量
    :param filename:
    :return:
    """
    return_vect = zeros((1, 1024))
    fr = open(filename)
    for i in range(32):              # 用for line in readlines()也可以
        line_str = fr.readline()      # 一行一行的读
        for j in range(32):
            return_vect[0, 32*i+j] = int(line_str[j])
    fr.close()
    return return_vect

有了上面的函数,就可以设计循环,把训练集,测试集,标
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值