简介
pytesseract是基于谷歌的tesseract的OCR包,支持识别一些简单的数字、字母、中文。
安装
安装引擎
下载地址: https://digi.bib.uni-mannheim.de/tesseract/ 一般是Windows 64位系统最新版:
如果要识别中文,注意选中中文模块。
把tesseract.exe目录加入Path,如D:\Program Files\Tesseract-OCR
。
安装pytesseract包
测试代码
相关链接
https://github.com/tesseract-ocr/tesseract