wxPython利用pytesser模块实现图片文字识别

原创

于 2013-05-29 16:48:11 发布 · 2.6w 阅读

30 ·

CC 4.0 BY-SA版权

文章标签：

#wxpython #pytesser #OCR #图片文字识别 #tesseract

本文介绍了如何利用Python的wxPython库和pytesser模块结合谷歌的Tesseract引擎进行OCR（光学字符识别）。首先，介绍了pytesser的下载和使用方法，包括如何提高图片识别率。接着，讲解了如何识别其他语言，需要下载对应的语言包并配置pytesser参数。最后，展示了如何在代码中调用image_to_string函数进行图片文字识别，并处理识别后的文本编码问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Pytesser——OCR in Python using the Tesseract engine from Google

pytesser是谷歌OCR开源项目的一个模块，在python中导入这个模块即可将图片中的文字转换成文本。

链接：https://code.google.com/p/pytesser/

pytesser 调用了 tesseract。在python中调用pytesser模块，pytesser又用tesseract识别图片中的文字。

下面是整个过程的实现步骤：

1、首先要在code.google.com下载pytesser。https://code.google.com/p/pytesser/downloads/detail?name=pytesser_v0.0.1.zip

这个是免安装的，可以放在python安装文件夹的\Lib\site-packages\ 下直接使用

pytesser里包含了tesseract.exe和英语的数据包（默认只识别英文），还有一些示例图片，所以解压缩后即可使用。

可通过以下代码测试：

>>> from pytesser import *
>>> image = Image.open('fnord.tif')  # Open image object using PIL
>>> print image_to_string(image)     # Run tesseract.

最低0.47元/天解锁文章

200万优质内容无限畅学