Python验证码(Pytesseract)

##一、描述
在爬虫的过程中,可能会遇到验证码,这时候就需要进行解析了,我在实验中也是遇到了很多的问题,终于是解决了,在此流程分享出来。
##二、验证码流程

####Pytesseract地址:pytesseract


#####第一步:在命令行打入以下代码,下载到本地

pip install pytesseract   
复制代码

#####第二部:安装tesseract-ocr(官方文档上也有说需要安装,就默认安装了)

http://download.csdn.net/download/whatday/7740469


#####第三步:在代码中加入以下代码,实验验证码

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract
print pytesseract.image_to_string(Image.open("test.png").convert('L')) #Convert能够优化识别
复制代码

输出结果

378m

复制代码

##三、验证码注意事项


#####**一,正常流程执行,遇到下面的问题**
![]@ST6}P]S)KK9.png](http://upload-images.jianshu.io/upload_images/2650372-af96906eba87201f.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240) 解决方法是找到你pytesseract的目录下,我的目录是下面的(如果找不到,可以再pip install pytesseract,会看到你安装的地址),打开pytesseract.py

修改成tesseract-ocr安装目录下的tesseract.exe,并且在路径前面加一个r,查了好久才发现需要加一个r,不然总是报错

 tesseract_cmd = 'tesseract'
复制代码

tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract.exe'
复制代码

##四、总结 希望有人也遇到这个问题,可以解决

转载于:https://juejin.im/post/5b3ac84ee51d455582018bff

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值