OCR识别是开源的字符识别库,在使用之前首先进行安装
-
https://digi.bib.uni-mannheim.de/tesseract/
打开该网址下载想要的tesseract安装包,直接点击next安装,在安装过程中复制安装路径 -
配置环境变量
-
系统变量和用户变量的path中添加如:E:\Program Files (x86)\Tesseract-OCR(即tesseract安装路径)
-
新建系统变量如下图:路径为E:\Program Files (x86)\Tesseract-OCR\tessdata
-
测试:安装完成后在cmd中输入tesseract -v,安装成功的测试结果如下:
-安装pytesseract,便于在python中调用
由于我只有一个Python环境,因此直接在cmd窗口中运行pip install pytesseract即可
- 修改代码
找到Python的安装目录,