python:文字识别（转自新浪博客恬月园）

dict

于 2014-10-27 21:27:28 发布

阅读量630

点赞数

文章标签：验证码识别 python ocr

（一）使用pytesser

1、下载安装pil

下载： http://www.pythonware.com/products/pil/

执行安装文件

2、下载安装pytesser

下载:http://code.google.com/p/pytesser/

解压，“...\pytesser”，设置环境变量PYTHONPATH，添加“...\pytesser”

3、程序执行

import os

import pytesser

os.chdir("E:/software/python/pytesser")

pytesser.image_file_to_string('c:/check.bmp')

参考:http://code.google.com/p/pytesser/

说明：该项目似乎只是"tesseract-ocr"一个ptyhon封装的外壳，并且此项目似乎还一直停留在0.01版没有更新,而且该外壳似乎还存在比较严重的bug,更深入的解决方案应该是参考"tesseract-ocr" 参考 http://code.google.com/p/tesseract-ocr/。

4、改进程序只能在当前目录下调用的问题

在目录下新增一个文件 mypytesser.py 文件

import os

import pytesser

def image_file_to_string(file):

cwd = os.getcwd()

try :

os.chdir("E:\software\python\pytesser")

return pytesser.image_file_to_string(file)

finally:

os.chdir(cwd)

在命令航使用一下命令进行图片解析

import mypytesser

print mypytesser.image_file_to_string("c:/check.bmp");

(二)自己编写代码来实现

http://blog.feshine.net/technology/1163.html

（三）tesseract-ocr基础

1、基本操作

cmd>tesseract c:\check1.bmp c:\check1

在tesseract.log可以看见程序反馈，但可以了解的信息不多，需要深入了解tesseract项目。

2、极容易出现的问题是，图像文件打开会报错，需要将图像文件的dpi改为200*200，可以用python代码解决：

python>>>import Image

python>>>image = Image.open(r”c:\check.bmp”)

python>>>image.save(r”c:\check1.bmp”, dpi=(200,200))

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python:文字识别（转自新浪博客恬月园）

（一）使用pytesser1、下载安装pil下载： http://www.pythonware.com/products/pil/执行安装文件2、下载安装pytesser下载:http://code.google.com/p/pytesser/解压，“...\pytesser”，设置环境变量PYTHONPATH，添加“...\pytesser”
复制链接

扫一扫

dict CSDN认证博客专家 CSDN认证企业博客

码龄16年

7: 原创

32万+: 周排名

86万+: 总排名

4万+: 访问

: 等级

433: 积分

17: 粉丝

4: 获赞

5: 评论

20: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何将开发好的安卓应用程序发布到安卓市场或商店
Amoour: 楼主可否告知抓猫这个软件在哪里可以下载？
如何将开发好的安卓应用程序发布到安卓市场或商店
热爱学习的胖子: 很棒
如何将开发好的安卓应用程序发布到安卓市场或商店
qq_42885297: 谢谢作者分享，楼住还可以再分享更多关于上架的技巧吗？好人一生平安！ [code=csharp] [/code]
在类中使用typedef定义新类型
dict: 你说的没错这个主要是为了定义冲突
在类中使用typedef定义新类型
biiu_bommmb: 博主说的不对吧？如果typedef在类内的权限是public，在类外是可以用的。测试代码： class A { public: typedef int ref_type; ref_type a; }; int main() { A::ref_type b = 0; cout<<b<<endl; return 0; }

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。