Python ocr哪个速度最快,Python ocr 版面分析

这篇文章主要介绍了Python ocr哪个速度最快,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获,下面让小编带着大家一起了解一下。

前不久看了一篇“如何使用Python检测和识别车牌?”用OpenCV对输入图像进行预处理,用imutils将原始输入图像裁剪成所需的大小,用pytesseract将提取车牌字符转换成字符串(车牌识别)。

但经实测,美式车牌识别基本正确,但中国92式车牌、新能源车牌识别基本失败,失败的现象主要是将汉字识别为字母,或将汉字与后面的字母合并识别为另一个汉字python含金量高的证书。将“GA36-2007中华人民共和国机动车号牌”标准上的37个汉字用pytesseract进行汉字识别,正确率小于50%,但网页截屏识别正确率极高(高于95%),只有极个别字识别错误。因此就用Python做了个界面,制作成了“简易OCR文字识别系统”,这样通过鼠标操作就可以将图片文字转换为文本文字(如图1所示),识别效果见图19~22。

1 简易OCR文字识别系统界面

一、pytesseract简介

tesseract原意为:宇宙魔方、超立方体、超正方体、四维超正方体、四次元立方体等意。pytesseract库是Python开源的OCR(光学字符识别)库,能够识别图片上的数字、英文和中文等。它要求字迹规整、清晰可见,适合识别印刷体(如报刊、杂志照片,电脑或手机截屏等)。其他如手写体、车牌、验证码等识别效果较差。

二、pytesseract安装

pytesseract库属于人工智能(AI)领域的库,需要配置底层应用和依赖库,不是一条pip就能完成安装。pytesseract库依赖Tesseract-OCR,也就是要安装Tesseract-OCR才有效。

1. 安装和配置Tesseract-OCR

Tesseract-OCR是一款由HP实验室开发,由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,Tesseract-OCR是可以不断地训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎(比如车牌识别)。

(1) 下载Tesseract-OCR

  1. GitHub 官网地址:查看源码

https://github.com/tesseract-ocr/tesseract

在这可以查看和下载源码,自己编译,如果不想查看源码。只想直接使用,请下载下面的官网安装包。

官网安装包下载地址1:https://digi.bib.uni-mannheim.de/tesseract/

官网安装包下载地址2:https://github.com/UB-Mannheim/tesseract/wiki 

本人安装的是tesseract-ocr-w64-setup-v5.3.0.20221214.exe(见图2)。

(2) 安装Tesseract-OCR

双击下载的安装包进行安装。

2 下载的安装包

选择语言就用默认的英语(此语言指安装程序所用语言)。

 3 选安装语言界面

待定安装时的语言(没有中文)后,选同意安装(I Agree)。

 4 授权协议界面

选择组件时,注意把汉字笔迹训练数据的简体、繁体都选上,这样可以进行简体汉字和繁体汉字的识别。

 5 选择安装组件界面

点Additional data (download)前的“+”,从中选图6中的4项:Han Simplified 、Han Simplified vertical (简体),Han Traditional 、Han Traditional vertical (繁体)。

 6 选择添加笔迹数据界面

把汉字语言训练数据的简体、繁体也都选上。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值