python识别图片中的文字处理方法

一、准备工作与代码实例

1、python2.7,PIL、pytesser

(1)安装PIL:下载地址:http://www.pythonware.com/products/pil/

下载后是一个exe,直接双击安装,它会自动安装到C:\Python27\Lib\site-packages中去,

(2)pytesser:下载地址:http://code.google.com/p/pytesser/,(CSDN下载

下载解压后直接放C:\Python27\Lib\site-packages(根据你安装的Python路径而不同),同时,新建一个pytesser.pth,内容就写pytesser,注意这里的内容一定要和pytesser这个文件夹同名,意思就是pytesser文件夹,pytesser.pth,及内容都要一样!



(3)将 'C:\Python27\Lib\site-packages\pytesser\pytesser.py' 里面的 tesseract_exe_name='tesseract' 里面是相对路径,改成绝对路径就好了:tesseract_exe_name='F:\\Python\\Lib\\site-packages\\pytesser\\tesseract', 将 import Image 改为 from PIL import Image

(4):

然后当安装好后运行:

from PIL import Image
from pytesser import * 


image = Image.open('captcha3.png') 
print image_to_string(image)


问题一、WindowsError: [Error 2] 

问题详细提示,如下:


产生原因: 调用tesseract.exe失败

解决:把tesseract.exe加入当前工程,如图:



说明:这个tesseract.exe就相当于在linux下的 tesseract-orc


问题二、IOError: [Errno 2] No such file or directory: 'tesseract.log'

问题详细提示,如下:


产生原因: 不是因为缺少tesseract.log而是因为缺少tessdata文件夹

解决:把tessdata文件夹从pytesser文件夹下拷贝到工程下,如图:



如果仍旧出现问题二,则试试换个tesseract.exe试试。



 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

huxiangen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值