Windows环境下安装tesseract-ocr配置环境变量
安装包地址:https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows
安装时需要选择中文语言包才是识别汉字
安装完成后,需要设置两个环境变量 $PATH(直接填入安装的路径) 和 $TESSDATA_PREFIX(这个需要新建)
检验是否安装成功
去你的安装目录,找到该程序并启动它
1.windows系统下,用pycharm安装tesserocr,安装失败的提示为
"Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools"
使用pip,pip3安装均失败,就不把失败的提示放出来了,找到方法解决才是最重要的
2.去这里找到python和window相对应的系统版本
https://github.com/simonflueckiger/tesserocr-windows_build/releases
3.cmd命令 进入tesserocr-2.2.2-cp36-cp36m-win_amd64.whl所在的文件目录(这是我的版本)
pip install <packagename> .whl
出现以下类似的安装成功提示就证明安装成功
Processing d:\tesserocr-2.2.2-cp36-cp36m-win32.whl
Installing collected packages: tesserocr
Successfully installed tesserocr-2.2.2
如果你使用pycharm去导入该包会发现还是失败
需要新建一个项目,然后勾选上