最近在用python学习网络爬虫,在自动识别验证码的那一节中,书上使用的是tesserocr 库。但是按照书上的安装过程操作一直报错,尝试了很久都没有安装成。,最后通过在网上找各种教程和很多大佬的分享,成功安装了。现在总结一下,分享给需要的人。废话不多说,开装
第一步:安装tesseract
tesserocr这个库是tesseract这个软件的一个python封装,python是通过tessercor 库来操作tesseract进行识别图片,所以要在python中使用该库,首先需要安装tesseract这个软件。
点击下载链接:http://digi.bib.uni-mannheim.de/tesseract,选择想要安装的版本,我当时安装的是3.05版本。注意:安装完之后,将安装的目录加入系统环境变量中。详细操作可以参考https://jingyan.baidu.com/article/6181c3e0c731ba152ef153cf.html
**
第二步:安装Aconda
**
书上包括很多网站上都是介绍直接使用pip命令安装,但是尝试过很多次都没有成功,一直会有新的错误报出来,最后决定使用aconda进行安装。关于Aconda的介绍与使用方法,可以看一下