ocr 光学字符识别(Optical Character Recognition)识别数字

本文介绍了使用OCR技术进行数字识别的过程,包括数据预处理、创建训练和测试数据集、模型建立、训练、预测及结果展示。通过K-邻近算法对28x28像素的图像进行扁平化处理,达到高识别准确率。
摘要由CSDN通过智能技术生成

文中数据下载
识别分析: 图片是二维的数组
图片原始数据

plt.imread('./digits/0/0_1.bmp')

array([[255, 255,
        255, 255],
        [255, 255,
        255, 255]], dtype=uint8)  

可以看出是一个二维数据, 但根据实际情况每行样本的列并不是样本的多个特征

根据实际情况,每个图片是一个样本,样本中的所有数据都是样本的特征

所以我们将每张图片做一下处理,将shape为28x28的改变为 1x784 的 数据 这样就可以进行K-邻近算法分类预测

图片预处理后的数据

data = data.flatten()  #将图片数据转为一维的
d
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值