这篇文章主要介绍了Python ocr哪个速度最快,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获,下面让小编带着大家一起了解一下。
前不久看了一篇“如何使用Python检测和识别车牌?”用OpenCV对输入图像进行预处理,用imutils将原始输入图像裁剪成所需的大小,用pytesseract将提取车牌字符转换成字符串(车牌识别)。
但经实测,美式车牌识别基本正确,但中国92式车牌、新能源车牌识别基本失败,失败的现象主要是将汉字识别为字母,或将汉字与后面的字母合并识别为另一个汉字python含金量高的证书。将“GA36-2007中华人民共和国机动车号牌”标准上的37个汉字用pytesseract进行汉字识别,正确率小于50%,但网页截屏识别正确率极高(高于95%),只有极个别字识别错误。因此就用Python做了个界面,制作成了“简易OCR文字识别系统”,这样通过鼠标操作就可以将图片文字转换为文本文字(如图1所示),识别效果见图19~22。
图1 简易OCR文字识别系统界面
一、pytesseract简介
tesseract原意为:宇宙魔方、超立方体、超正方体、四维超正方体、四次元立方体等意。pytesseract库是Python开源的OCR(光学字符识别)库,能够识别图片上的数字、英文和中文等。它要求字迹规整、清晰可见,适合识别印刷体(如报刊、杂志照片,电脑或手机截屏等)。其他如手写体、车牌、验证码等识别效果较差。
二、pytesseract安装
pytesseract库属于人工智能(AI)领域的库,需要配置底层应用和依赖库,不是一条pip就能完成安装。pytesseract库依赖Tesseract-OCR,也就是要安装Tesseract-OCR才有效。
1. 安装和配置Tesseract-OCR
Tesseract-OCR是一款由HP实验室开发,由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比,Tesseract-OCR是可以不断地训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎(比如车牌识别)。
(1) 下载Tesseract-OCR
- GitHub 官网地址:查看源码
https://github.com/tesseract-ocr/tesseract
在这可以查看和下载源码,自己编译,如果不想查看源码。只想直接使用,请下载下面的官网安装包。
官网安装包下载地址1:https://digi.bib.uni-mannheim.de/tesseract/
官网安装包下载地址2:https://github.com/UB-Mannheim/tesseract/wiki
本人安装的是tesseract-ocr-w64-setup-v5.3.0.20221214.exe(见图2)。
(2) 安装Tesseract-OCR
双击下载的安装包进行安装。
图2 下载的安装包
选择语言就用默认的英语(此语言指安装程序所用语言)。
图3 选安装语言界面
待定安装时的语言(没有中文)后,选同意安装(I Agree)。
图4 授权协议界面
选择组件时,注意把汉字笔迹训练数据的简体、繁体都选上,这样可以进行简体汉字和繁体汉字的识别。
图5 选择安装组件界面
点Additional data (download)前的“+”,从中选图6中的4项:Han Simplified 、Han Simplified vertical (简体),Han Traditional 、Han Traditional vertical (繁体)。
图6 选择添加笔迹数据界面
把汉字语言训练数据的简体、繁体也都选上。