前段时间买了一本崔庆才的《Python3网络爬虫开发实践》,看到验证码识别的那部分,牵扯到tesseract和tesserocr安装,自己也尝试了一下,结果各种报错,后来再网上各种查找、测试,统统没有用,后来在一位老哥的提醒下全部安装成功,特意发个帖,能帮到别人更好,我用的Mac book pro2018款,系统是Catalina10.15.5,用Pycharm。
先说一下网上流行的方法:
首先使用 Homebrew安装 ImageMagick和 tesseract库 :
brew install imagemagick
brew install tesseract --all-languages
接下来再安装 tesserocr即可:
pip3 install tesserocr pillow
之后就会报错,信息大概就是这样
/usr/local/include/tesseract/host.h:28:10: fatal error: 'cstdint' file not found
#include <cstdint> // int32_t, ...
^~~~~~~~~
error generated.
error: command 'gcc' failed with exit status 1
-------------------------------------------
网上有两个解决方法:
方法一:
按路径将 host.h文件中的 include为 include<stdint.h
方法二:
安装了Anaconda,但是说vscode下还是用不了。
以上两种方法,不知道具体结果怎么样,前者因为我确实对Mac的文件夹不是很熟悉,找不到网上说的路径文件里host.h,后者是因为我比较习惯用Pycharm,Anaconda刚开始学习的时候用了一下,后来就给删掉了。然后我就又开始漫无目的的在网上找,在别人的启发下(当然也怪自己粗心,其实终端安装的时候已经提醒过了)我尝试着安装了一下Homebrew,结果万事大吉,一切OK。
所以,再提醒下,如果各位在安装时终端提示 :
-bash:brew:command not found
请记住:安装Homebrew、安装Homebrew、安装Homebrew,具体怎么装,请大家参考如下文章:Homebrew的国内安装脚本,从此告别龟速更新,友情提醒一下,个人建议选序号1,中科大下载源,相对稳定且速度最快,如果安装过程中遇到什么问题,请重启、重启、重启。安装好之后,在执行如下代码:
brew install imagemagick
brew install tesseract --all-languages
这里建议用,前者会报错:
brew install tesseract
之后:
pip3 install tesserocr pillow
一切就OK啦。
第一次发帖,可能看着有点乱,但是经验都是来自于我的亲身实践,希望能让看到的人少走弯路,不足之处还请谅解。