opencv+KNN实现手写简单数字识别

学长要求做一个可视化的与数据分析的程序,就想到了这个,用了最简单的方法,其实识别效率不是很高,基本上书写要与训练数据比较相似才能识别出来,正在想办法去优化,先把目前的成果分享出来,本人是用python+opencv做的。

draw.py

相当于一个写字板,将写完字后的图片保存转为32*32

#encoding:utf-8
import cv2
import numpy as np #mouse callback function
from knn import *
ix,iy=-1,-1
#创建图像与窗口并将窗口与回调函数绑定
def in_img():
    for i in range(512):
        img[i,:]=255
    cv2.namedWindow('image')
    cv2.setMouseCallback('image',draw_circle)
    while(1):
        cv2.imshow('image',img)
        if cv2.waitKey(20)& 0xFF == ord('q'):
            cv2.imwrite( '1.jpg',img)
            break
    cv2.destroyAllWindows()
def draw_circle(event,x,y,flags,param):
    global ix,iy,drawing
    if event==cv2.EVENT_LBUTTONDOWN:
        drawing=True
        ix,iy=x,y
    elif event==cv2.EVENT_MOUSEMOVE and flags==cv2.EVENT_FLAG_LBUTTON:
        if drawing==True:
            cv2.circle(img,(x,y),30,(0,0,0),-1)
    elif event==cv2.EVENT_LBUTTONUP:
        drawing==False
def read_image():
    img1 = cv2.imread('1.jpg', cv2.IMREAD_GRAYSCALE)
    res=cv2.resize(img1,(32,32),interpolation=cv2.INTER_CUBIC)
    pic=[]
    for i in range(32):
        for j in range(32):
            if res[i][j]<=200:
                res[i][j]=1
            else:
                res[i][j]=0
            pic.append(int(res[i][j]))
    hwLabels,trainingMat = trainingDataSet()
    classifierResult = classify(pic, trainingMat, hwLabels, 3)
    print classifierResult
def main():
    global img
    img=np.zeros((512,512,3),np.uint8)
    in_img()
    read_image()
if __name__=="__main__":
    main()
knn.py

利用KNN算法找到离测试数据最近的10个点(程序中可以调),然后在这10个数据中选取出现次数最多的,即为测试数据代表的数据。

#encoding: utf-8
from numpy import *
import operator
import time
from os import listdir
def classify(inputPoint,dataSet,labels,k):
    dataSetSize = dataSet.shape[0]	 #已知分类的数据集(训练集)的行数
    #先tile函数将输入点拓展成与训练集相同维数的矩阵,再计算欧氏距离
    diffMat = tile(inputPoint,(dataSetSize,1))-dataSet  #样本与训练集的差值矩阵
    sqDiffMat = diffMat ** 2					#差值矩阵平方
    sqDistances = sqDiffMat.sum(axis=1)		 #计算每一行上元素的和
    distances = sqDistances ** 0.5			  #开方得到欧拉距离矩阵
    sortedDistIndicies = distances.argsort()	#按distances中元素进行升序排序后得到的对应下标的列表
    #选择距离最小的k个点
    classCount = {}
    for i in range(k):
        voteIlabel = labels[ sortedDistIndicies[i] ]
        classCount[voteIlabel] = classCount.get(voteIlabel,0)+1
    #按classCount字典的第2个元素(即类别出现的次数)从大到小排序
    sortedClassCount = sorted(classCount.items(), key = operator.itemgetter(1), reverse = True)
    return sortedClassCount[0][0]
def img2vector(filename):
    returnVect = []
    fr = open(filename)
    for i in range(32):
        lineStr = fr.readline()
        for j in range(32):
            returnVect.append(int(lineStr[j]))
    return returnVect
def classnumCut(fileName):
    fileStr = fileName.split('.')[0]
    classNumStr = int(fileStr.split('_')[0])
    return classNumStr
#构建训练集数据向量,及对应分类标签向量
def trainingDataSet():
    hwLabels = []
    trainingFileList = listdir('trainingDigits1')		   #获取目录内容
    m = len(trainingFileList)
    trainingMat = zeros((m,1024))						  #m维向量的训练集
    for i in range(m):
        fileNameStr = trainingFileList[i]
        hwLabels.append(classnumCut(fileNameStr))
        trainingMat[i,:] = img2vector('trainingDigits1/%s' % fileNameStr)
        #print type(trainingMat)
    return hwLabels,trainingMat

我个人还写了个数据,可以自己建立一些测试数据,对于书写有着特殊风格的人可以尝试,当然如果你非常感兴趣的话,还可以用这个程序建立关于英文字母的测试数据,然后用上面的KNN识别英文字母

train_data.py

#encoding:utf-8
import cv2
import numpy as np #mouse callback function
from knn import *
ix,iy=-1,-1
#创建图像与窗口并将窗口与回调函数绑定
def in_img():
    for i in range(512):
        img[i,:]=255
    cv2.namedWindow('image')
    cv2.setMouseCallback('image',draw_circle)
    while(1):
        cv2.imshow('image',img)
        if cv2.waitKey(20)& 0xFF == ord('q'):
            cv2.imwrite( '1.jpg',img)
            break
    cv2.destroyAllWindows()
def draw_circle(event,x,y,flags,param):
    global ix,iy,drawing
    if event==cv2.EVENT_LBUTTONDOWN:
        drawing=True
        ix,iy=x,y
    elif event==cv2.EVENT_MOUSEMOVE and flags==cv2.EVENT_FLAG_LBUTTON:
        if drawing==True:
            cv2.circle(img,(x,y),20,(0,0,0),-1)
    elif event==cv2.EVENT_LBUTTONUP:
        drawing==False
def read_image():
    img1 = cv2.imread('1.jpg', cv2.IMREAD_GRAYSCALE)
    res=cv2.resize(img1,(32,32),interpolation=cv2.INTER_CUBIC)
    pic=[]
    for i in range(32):
        for j in range(32):
            if res[i][j]<=200:
                res[i][j]=1
            else:
                res[i][j]=0
            pic.append(int(res[i][j]))
    f=open('trainingDigits/6_9.txt','w')
    for i in range(32):
        for j in range(32):
            f.write(str(res[i][j]))
        f.write("\n")
    f.close()
def main():
    global img
    img=np.zeros((512,512,3),np.uint8)
    in_img()
    read_image()
if __name__=="__main__":
    main()

结语:个人有一个想法,因为原先的测试数据太多,再加上KNN本身只属于一种算法,并不是一种可建立的模型,每一次识别的时间花费非常长,利用KNN+Adaboost算法尝试尝试,感兴趣的话可以尝试一下

数据来源:http://pan.baidu.com/s/1eQIM4Lk?errno=0&errmsg=Auth%20Login%20Sucess&stoken=9002846861134dfc8b364739cf183e78edcb825ba47e18b1fcfca477d2863a584d122304c8a8739cdcea6bdc3729b78c16da28d4fde8764a0e6b93faf67a6af4d40a3b562d36&bduss=7a7eb001d8d08e2603aaf1732e36c0aa6d77a46d41a907ceb00444543799daedca40105c7c29c9ad32852f293a6013324a71513422ba2cb7cb6b48b3c7679e28c47126a05d0266522fa40883397d046b45914a76628db9b3faefe0e76c5ef6ca53477ffd4a80f84c0d070ff26f672d6c1f00d2aad9b4d034924b1cea44720b551f522bd7160652a38e6b4a851640396f9e93d02424b8674f7c55035c9d5fb8499098a7624e3aa82470a2df78f8585583a1a00f163046b736c36f4ab03ab08269923fcdbb4bfa&ssnerror=0

最后贴一张效果图:



  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
【课程简介】 本课程基于面向Python的OpenCV,以OpenCV的官方文档的知识脉络为主线,介绍了OpenCV函数的具体使用方法、函数所使用的算法的具体原理。 在介绍函数使用时,提供了大量的程序案例演示。 在介绍具体原理时,采用了通俗易懂的语言和贴近生活的示例来说明问题,尽量避免涉及过于复杂抽象的公式。 课程包含数字图像处理的常用知识点,覆盖面全,方便学员系统深入全面地掌握OpenCV。 【你将收获什么】 1.  掌握数字图像的在计算机内表示的方法和处理的基本原理。掌握数字图像的表示方法是进行图像处理的前提和基础,能够为后续的智能图像处理打下坚实基础。 2.  使用好OpenCV开源库对于提升工作效率具有很大的帮助。OpenCV是优秀的开源库,提供了大量的函数帮助我们提升工作效率。大多数情况下,我们直接调用函数就能够满足我们的需求。同时,它的函数具有较好的交互性,能够根据需要更好地掌控图像处理的具体细节。 3.  学习图像处理的常用算法。课程不仅介绍函数的具体使用,也介绍了常用算法的基本原理,帮助学习者更好地理解图像处理的基本逻辑、方法,快速入门图像处理领域。 【我将如何教你】 1)在“黑盒”和“白盒“之间取得平衡  可以将OpenCV看成“黑盒”,不用关心其函数是如何实现的。在需要实现某一个功能时,直接调用其对应的函数即可,像使用Photoshop的各种功能一样。也可以将OpenCV看成“白盒”,关注其每一个函数的具体实现,认真研究每一个函数的具体实现方法和实现细节。这两种方式都是学习图像处理的很好方式,但是大多数课程过于强调其中某一种,要么忽略了算法的实现、要么忽略了使用方法。本课程尽量将OpenCV在“黑盒”和“白盒”之间取得平衡。既介绍算法的原理和方法,又将重点放在如何调用函数上,让学习者能够更加游刃有余地在计算机视觉项目中使用OpenCV来解决具体的问题。 2)将枯燥的算法采用具体的案例介绍  在图像处理中,有大量的算法保证了图像处理的准确、高效。OpenCV将一些常用的算法进行了封装,我们可以直接调用OpenCV的函数来使用对应的算法。但是,深入地理解算法能够帮助学习者更好地使用OpenCV函数。本课程尝试抛弃传统的使用复杂公式介绍算法的形式,尽量通过简单、通俗易懂的生活中实例来帮助学习者理解算法的基本逻辑 3)案例驱动、强调实战 OpenCV是一个庞大的资源库,提供了非常多的函数帮助我们高效地处理问题。初学者使用OpenCV的最大困惑就是熟练地掌握了每一个函数的调用方法,但是在解决实际问题时,不知道具体应该使用哪个函数。本课程通过大量的具体案例帮助学习快速掌握每个函数的应用场景,快速掌握OpenCV的核心使用方法和技巧。
Sure, 我可以回答你的问题。以下是一个基于 OpenCVKNN数字识别代码示例: ```python import cv2 import numpy as np # Load the dataset for training digits = cv2.imread('digits.png',0) digits = cv2.resize(digits, (1000, 2000)) # Split into individual digit images rows = np.vsplit(digits,50) cells = [] for row in rows: row_cells = np.hsplit(row,50) for cell in row_cells: cell = cell.flatten() cells.append(cell) X = np.array(cells, np.float32) # Create labels for each digit y = np.repeat(np.arange(10),250) # Train a KNN model on the dataset knn = cv2.ml.KNearest_create() knn.train(X, cv2.ml.ROW_SAMPLE, y) # Load the image and preprocess it for prediction img = cv2.imread('test.png',0) img = cv2.resize(img, (28,28)) img = img.reshape(-1,28*28) img = np.float32(img) # Use the KNN model to predict the digit ret,result,neighbours,dist = knn.findNearest(img,k=5) # Print the predicted digit print(int(result[0][0])) ``` 在上述示例中,我们首先加载包含许多数字的数据集。我们将数据集拆分为50x50个单元格,并将每个单元格转换为一维向量。然后我们创建标签,其中每个标签对应于一个数字,并使用KNN模型进行训练。我们然后加载一个包含数字的测试图像,预处理图像以适合KNN模型,使用KNN模型预测数字,并打印结果。 注意,在实际应用中,您可能需要对识别准确性、计算效率和对错误处理的能力进行更多的优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值