第二章 K-近邻算法 及 手写识别系统

本文介绍了一个手写数字识别系统的构建过程,利用K-近邻(K-NN)算法进行分类。训练数据包含约2000个例子,需要将32x32的图像转化为1x1024的向量。作者实现了`img2vector`函数以完成图像到向量的转换,并提及K-NN算法在实际运行中效率不高,后续会讨论更高效的k决策树算法。此外,还介绍了Python中使用time()函数进行计时的方法。
摘要由CSDN通过智能技术生成

这一节主要是手写识别数字系统的搭建。实际训练数据在 trainingDigits 里面,大约2000个例子。

为了使用之前 2.2 的分类器,要把图像格式化处理为一个向量,32*32 变成 1* 1024。

首先写一个 img2vector 函数,打开给定文件,循环读出前32行,然后把每行的头32个字符存在 NumPy 数组里面,最后返回数组。

这个片段加在之前 kNN.py 里面。

def img2vector(filename):
    returnVect = zeros((1,1024))
    fr = open(filename)
    for i in range(32):
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])
    return returnVect

然后写测试代码:

def
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值