pytesseract 是一个文字识别模块,现将安装、使用记录如下:
安装模块
pip3 install pytesseract
pip3 install opencv-python # 图形处理软件包
pip3 install pillow # PIL用于打开图片文件
安装程序
下载地址:https://github.com/UB-Mannheim/tesseract/wiki
安装识别软件,并设置环境参数(tesseract-ocr-w32-setup-v5.3.0.20221214.exe):
安装目录:C:\usr\Tesseract-OCR
设置环境变量:PATH
使用案例
使用白名单可以极大提高识别准确度,从30%提高到95%,请参照以下语句
pytesseract.image_to_string(im_01, config="-c tessedit_char_whitelist=0123456789 --psm 7")
直接识别,不处理截图
参考资料