1.用于识别验证码:OCR,即 Optical Character Recognition,光学字符识别
2.要安装tesserocr先安装 tesseract :选 Additional language data(download)选项来安装 OCR识别支持的语言包,这样 OCR 便可以识别多国语言。 然后一路点击 Next 按钮即可 ()
2-1:配置环境变量: C:\pachongxiangguan\tesseract\Tesseract-OCR
用户变量 : key : Pathon value :C:\pachongxiangguan\tesseract\Tesseract-OCR
系统变量: key : TESSDATA_PREFIX value:C:\pachongxiangguan\tesseract\Tesseract-OCR
验证tesseract是否安装成功:
cd 进去 Tesseract-OCR文件夹 执行:
tesseract -v
至此:tesseract就安装好了。
3.然后使用 pip install tesserocr pillow 会出错 所以选择用:下载tesseract的whl文件,然后再通过pip安装
whl下载地址:选择自己对应的版本 https://github.com/simonflueckiger/tesserocr-windows_build/releases
pip3 install tesserocr-2.4.0-cp36-cp36m-win_amd64.whl
其中cp36 代表python3.6版本 所以如果是python 2 请更换至python3
- 待续…