目的是要用pytesser实现验证码识别,首先要准备好工具
- 下载pytesser模块,并导入。导入方法等下说。
- 下载完PIL之后,直接安装即可,系统自动检测python目录
- 在pytesser文件里面就有tesseract.(是否需要再下载tesseract,个人觉得可以不用了吧.)
- 在pytesser文件夹里有个tessdata文件夹,用来存放语言包。语言包下载地址
导入pytesser模块(即为Python添加默认模块搜索 )
以下三种方法选一种,一般使用第三种方法。
1. 动态增加
在代码里添加以下类似代码
import sys
sys.path.append("c:\\")
PS:可用print sys.path里的python默认搜索模块路径
2.修改环境变量
在Windows OS下修改系统环境变量PYTHONPATH
3.添加.pth文件方式
复制pytesser文件夹到/Lib/site-packages目录下,并在/Lib/site-packages目录下添加一个路径文件命名为pytesser.pth,以.pth为后缀,并用记事本在文件里写上想加入的