计算机视觉和Python 学习记录(三)

本文介绍了KNN算法的基本概念和在印刷体数字识别中的应用流程。首先讲解了KNN算法的原理,然后详细阐述了数字识别的四个步骤:数据采集、图像预处理、数字分割和数字识别。在数字识别部分,提到了使用英国萨里大学提供的数据集,并通过特征匹配、欧式距离计算来实现识别。最后,讨论了如何选择特征值和计算准确率。
摘要由CSDN通过智能技术生成

Python可以使用上一节安装的IDE也可以通过终端来进行练习,可通过Python官网(The Python Tutorial — Python 3.10.6 documentation)进行学习,本节首先记录KNN算法在印刷体数字识别中的应用过程。

一、什么是KNN算法

视频流的每一帧就是一张图片,因此处理计算机视觉产生的视频流的基础就是数字图像处理,那么我们就先从数字图像处理最简单的印刷体数字识别以及最简单经典的KNN算法开始吧。

KNN算法即K-Nearest Neighbor算法的缩写,由 Cover和Hart于1968年提出,是一种分类(classification)算法,适合用于数字识别和数据分析等场景。核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性,包括根据特征值进行分类的数据集、测量与不同特征值的距离、选择K个最短距离的数据(其中K为奇数,自行设定)。

二、印刷体数字识别

步骤如下:

(一)数据采集:通过摄像头拍摄等方式获取图片,如药品追溯码的图片,包括条形码和条形码下方的遗传数字。

(二)图像预处理:通过滤波器去噪、腐蚀、膨胀、二值化等方式进行处理。

(三)数字分割:在切除黑边、黏连区域修复等数字数字预处理后,采用连通域或投影法进行数字切割,并进行数字归一化处理。

(四)数字识别

1、选择数据集,因为我们是印刷体的数字可以访问英国萨里大学的网站(The Chars74K image dataset - Character Recognition in Natural Images),选择EnglishFnt.tgz 去掉A-Z和a-z共52个文件夹,只保留0-9共10个分类;

2、选择数据集分为训练集和验证集,分别占90%和10%,比例可以自己定,首先进行特征匹配提取特征,通过判断数字横线和竖线过线次数来提取训练集中国0-9的特征值,形成10维特征矩阵。然后计算验证集数据与特征矩阵的欧式距离最小的K个值,计算出准确率。

3、求取与10维特征矩阵的欧氏距离,根据欧式距离最小的K个值,并把距离最小的特征向量对应的数字作为识别结果。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值