解决tesserocr无法安装
今天学习识别图形验证码需要安装tesserocr这个库,下面介绍下tesserocr;
tesserocr是Python的一个OCR识别库,但其实是对tesseract做了一层Python Api的封装,核心还是tesseract,所以在安装tesserocr之前,需要先安装tesseract;
OCR
OCR,全称叫 Optical Character Recognition,中文翻译叫光学字符识别,是指通过扫描字符,通过其形状将其翻译成电子文本的过程;
tesseract
tesseract是google开源的OCR
下面直接上安装过程吧!
准备环境
下载安装tesseract
在Windows下,要先下载tesseract,它为tesserocr提供了支持;
tesseract官网下载地址:https://digi.bib.uni-mannheim.de/tesseract/
tesseract百度网盘下载链接
https://pan.baidu.com/s/1IBTe0zFEevnJneN27TNiPQ
提取码:upv1
打开后,可以看到各种exe的列表,可以随便挑选;
其中文件名中带有dev的为开发版本,不带dev则为稳定版本,例如jb是下载 tesseract-ocr-setup-3.05.01.exe;
下载完成后一路next就好
特别注意:
需要注意的是如果安装过程中提示上面的错误,点击确定即可,不必在意。那个错误的意思是语言包下载失败,后面我们可以进行下载。所以只需要一路确定就没问题
安装刚才错误的语言包
官网链接为:https://github.com/tesseract-ocr/tessdata
百度网盘下载连接:链接:https://pan.baidu.com/s/1LH0OI_6FE3g9CXW1Yl7_rw
提取码:2nqk
如何验证tesseract是否安装成功?直接cmd下输入tesseract即可;
成功会直接显示信息;
到此为止,tesseract安装成功啦~
安装tesserocr
首先尝试使用pip命令安装:
pip3 install tesserocr install
结果报错了
下面的种尝试就不给大家介绍了,下面说一个可行的安装方法
1、首先我们下载anaconda
2、配置 anaconda 环境 (以下所有命令在下面这个命令窗口进行)
conda config --add channels
https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
3、通过 conda 命令安装
conda install -c simonflueckiger tesserocr
这几条命令运行结果如图所示:
至此最终就安装上tesserocr啦~
验证 tesserocr安装成功
直接import tesserocr,不报错就说明安装好了;
如图:
以上就是无法安装tesserocr的全部解决办法,希望能够对你有帮助