Python ocr哪个速度最快,Python ocr 版面分析

最新推荐文章于 2024-06-14 14:52:10 发布

Bxwfjdjdbdgj

最新推荐文章于 2024-06-14 14:52:10 发布

阅读量891

点赞数 30

文章标签：人工智能

本文链接：https://blog.csdn.net/Bxwfjdjdbdgj/article/details/136796097

版权

这篇文章主要介绍了Python ocr哪个速度最快，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获，下面让小编带着大家一起了解一下。

前不久看了一篇“如何使用Python检测和识别车牌？”用OpenCV对输入图像进行预处理，用imutils将原始输入图像裁剪成所需的大小，用pytesseract将提取车牌字符转换成字符串(车牌识别)。

但经实测，美式车牌识别基本正确，但中国92式车牌、新能源车牌识别基本失败，失败的现象主要是将汉字识别为字母，或将汉字与后面的字母合并识别为另一个汉字python含金量高的证书。将“GA36-2007中华人民共和国机动车号牌”标准上的37个汉字用pytesseract进行汉字识别，正确率小于50%，但网页截屏识别正确率极高(高于95%)，只有极个别字识别错误。因此就用Python做了个界面，制作成了“简易OCR文字识别系统”，这样通过鼠标操作就可以将图片文字转换为文本文字(如图1所示)，识别效果见图19~22。

图1 简易OCR文字识别系统界面

一、pytesseract简介

tesseract原意为：宇宙魔方、超立方体、超正方体、四维超正方体、四次元立方体等意。pytesseract库是Python开源的OCR(光学字符识别)库，能够识别图片上的数字、英文和中文等。它要求字迹规整、清晰可见，适合识别印刷体(如报刊、杂志照片，电脑或手机截屏等)。其他如手写体、车牌、验证码等识别效果较差。

二、pytesseract安装

pytesseract库属于人工智能(AI)领域的库，需要配置底层应用和依赖库，不是一条pip就能完成安装。pytesseract库依赖Tesseract-OCR，也就是要安装Tesseract-OCR才有效。

1. 安装和配置Tesseract-OCR

Tesseract-OCR是一款由HP实验室开发，由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。与Microsoft Office Document Imaging(MODI)相比，Tesseract-OCR是可以不断地训练的库，使图像转换文本的能力不断增强；如果团队深度需要，还可以以它为模板，开发出符合自身需求的OCR引擎(比如车牌识别)。

(1) 下载Tesseract-OCR