使用kNN算法识别手写数字

完整代码可从https://github.com/TimeIvyace/kNN.git中下载

trainingDigits文件夹中为训练数据,里面存储的都是32*32的txt格式的数字图像数值矩阵。testDigits文件夹中为测试数据,存储格式与trainingDigits中相同。文件格式名例如:0_1.txt,0为数字的标签(即数字本身),1为表示数字0的第一个文件。代码为:

form numpy import *
from os import listdir
def handwritingClassTest():
    hwLabels = [] #标签集
    trainingFileList = listdir('digits/trainingDigits') #listdir获取训练集的文件目录
    m = len(trainingFileList) #文件数量
    trainingMat = zeros((m, 1024)) #一个数字1024个字符,创建m*1024的数组
    for i in range(m):
        fileNameStr = trainingFileList[i] #获取文件名
        fileStr = fileNameStr.split('.')[0] #以'.'将字符串分割,并取第一项,即0_0.txt取0_0
        classNumStr = int(fileStr.split('_')[0]) #以'_'将字符串分割,并取第一项
        hwLabels.append(classNumStr) #依次存入hwLabels标签集
        trainingMat[i, :] = img2vector('digits/trainingDigits/%s' % fileNameStr) #将每个数字的字符值依次存入trainingMat
    testFileList = listdir('digits/testDigits') #读入测试数据集
    errorCount = 0.0 #测试错误数量
    mTest = len(testFileList) #测试集的数量
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]
        classNumStr = int(fileStr.split('_')[0]) #测试数据标签
        vectorUnderTest = img2vector('digits/testDigits/%s' % fileNameStr) #读入测试数据
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3) #分类器kNN算法,3为最近邻数目
        print("the calssifier came back with: %d, the real answer is : %d" %(classifierResult, classNumStr))
        if (classifierResult != classNumStr): errorCount +=1.0
    print("\nthe total number of errors is : %f" % errorCount)
    print("\nthe total error rate is :%f" % (errorCount/float(mTest)))

handwritingClassTest()
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值