python3与机器学习实践---2、KNN实现手写数字识别

最新推荐文章于 2022-11-07 13:45:29 发布

wanghowie

最新推荐文章于 2022-11-07 13:45:29 发布

阅读量527

点赞数

分类专栏： python3与机器学习文章标签： python 机器学习 KNN 数字识别

本文链接：https://blog.csdn.net/u010105645/article/details/78787444

版权

python3与机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在机器学习实践中，关于KNN的最后一个实例是实现手写数字的的识别，这里对实例进行分析。

首先，简要介绍一下：KNN实现对手写数字0-9的识别，这个实例并不适合去处理手写多位数的识别。而且实例中，已经将训练样本库和测试样本库中的手写数字图片二值化，并将每张图片对应的灰度值存放到了.txt文件，以便于程序读取。每张图片的大小为32x32。

第一段代码：

功能：读取图片信息，并将32x32的矩阵，转化为1x1024的向量。

python函数解析：

def img2vector(filename):
    returnVect = zeros((1,1024))  #用于存储每张手写数字图像信息的1*1024矩阵
    fr = open(filename)
    for i in range(32):    #嵌套的for
        lineStr = fr.readline()
        for j in range(32):
            returnVect[0,32*i+j] = int(lineStr[j])
    return returnVect

第二段代码：

def handwritingClassTest():
    hwLabels = []
    trainingFileList = listdir('trainingDigits')#获取文件夹下的子文件、文件夹数
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))    #训练样本的向量数据存储到一个m*1024的矩阵中
    for i in range(m):
        fileNameStr = trainingFileList[i]   #获取文件名0_0.txt，并拆分获得文件所代表的数字0_0:第一位：数字，第二位：样本序号
        fileStr = fileNameStr.split('.')[0]  
        classNumStr = int(fileStr.split('_')[0])
        hwLabels.append(classNumStr)   #将样本手写数字对应的分类记录在hwLabels中
        trainingMat[i,:] = img2vector('trainingDigits/%s' % fileNameStr)
    testFileList = listdir('testDigits')
    errorCount = 0.0
    mTest = len(testFileList)
    for i in range(mTest):
        fileNameStr = testFileList[i]
        fileStr = fileNameStr.split('.')[0]
        classNumStr = int(fileStr.split('_')[0])
        vectorUnderTest = img2vector('testDigits/%s' % fileNameStr)
        classifierResult = classify0(vectorUnderTest, trainingMat, hwLabels, 3)  #识别，在量一篇文章中定义了knn算法
        print("the classifier came back with: %d, the real answer is: %d" % (classifierResult, classNumStr))
        if (classifierResult != classNumStr): errorCount += 1.0   #记录出错
    print ("\nthe total number of errors is: %d" % errorCount)   #输出出错数
    print("\nthe total error rate is: %f" % (errorCount/float(mTest)))  #输出错误率

wanghowie

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python3与机器学习实践---2、KNN实现手写数字识别

在机器学习实践中，关于KNN的最后一个实例是实现手写数字的的识别，这里对实例进行分析。首先，简要介绍一下：KNN实现对手写数字0-9的识别，这个实例并不适合去处理手写多位数的识别。而且实例中，已经将训练样本库和测试样本库中的手写数字图片二值化，并将每张图片对应的灰度值存放到了.txt文件，以便于程序读取。每张图片的大小为32x32。第一段代码：功能：读取图片信息，并将32x32的矩阵，
复制链接

扫一扫

专栏目录