光学字符识别 Tesseract-OCR 的下载、安装和基本用法

OCR:即Optical Character Recognition,光学字符识别,是指检查纸或者图片上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;

Tesseract-OCR:一款由HP实验室(惠普布里斯托实验室)开发,由Google维护的开源OCR引擎,可以经过不断的训练,增强图像转换文本的能力,Tesseract-OCR 也经常被用于Python爬虫的验证码识别

1、下载安装Tesseract-OCR

官方GitHub地址:https://github.com/tesseract-ocr/

下载地址一:https://github.com/UB-Mannheim/tesseract/wiki (仅Windows操作系统,最新版本)
下载地址二:https://digi.bib.uni-mannheim.de/tesseract/ (仅Windows操作系统,历史版本)
下载地址三:https://github.com/tesseract-ocr/tesseract/wiki (其他操作系统)

以下以 V5.0.0 版本为例进行安装,双击 tesseract-ocr-w64-setup-v5.0.0-alpha.20190708.exe 安装程序,基本上一直next就OK了,注意要勾选 Additional language data(download) 安装OCR识别支持的语言包
01
02
03
在这里勾选 Additional language data(download) ,安装OCR识别支持的语言包,在安装语言包时会比较慢,所以建议不要全选,根据需要选择即可,若后期需要增加语言包,可在官网下载后放到Tesseract-OCR\tessdata\tessconfigs目录下即可,不同版本的对应的语言包也不同,下载地址:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302
05
06

2、配置环境变量

依次右键【此电脑】-【属性】-【高级系统设置】-【环境变量】,在【系统变量】里找到【Path】变量,选择【编辑】-【新建】,将你的Tesseract-OCR安装路径填写进去,比如我的是:E:\Tesseract-OCR,点击确定保存即可
07

3、测试是否成功安装

打开cmd,输入 tesseract 会显示一些 Tesseract-OCR 相关用法提示,输入 tesseract -v 可以查看到 Tesseract-OCR 的版本信息,说明此时安装成功
08
09

4、基本用法

完整命令:tesseract 图片路径和图片名 结果路径和结果名 -l 语言
举例:tesseract F:\code\test.png F:\code\result -l eng
注意:
1、需要识别的图片要加后缀
2、结果文件名不需要加后缀,会自动加后缀,生成的是txt文件
3、-l 是英文字母l,不是数字1,language 语言的意思,不加默认英文
4、eng 表示英文,chi_sim 表示简体中文
5、将cmd切换到要识别图片的文件夹后,就不用加图片路径
03
在 Python 中使用:(需要安装 pytesseract 库)

import pytesseract
from PIL import Image

# 打开图片
img = Image.open('图片路径和图片名')
# 识别图片
print(pytesseract.image_to_string(img))
  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Tesseract-OCR是一个开源的OCROptical Character Recognition光学字符识别)引擎,可以用于将图像中的文字转换为可编辑的文本。下面是安装Tesseract-OCR的步骤: 1. 首先,你需要下载安装Tesseract-OCR引擎。你可以从Tesseract的官方GitHub页面(https://github.com/tesseract-ocr/tesseract)上找到最新的版本。根据你的操作系统,选择相应的安装包进行下载。 2. 安装完成后,将Tesseract-OCR添加到系统的环境变量中。这样你就可以在任何位置使用Tesseract命令。 3. 接下来,你需要下载训练数据文件(语言数据)。Tesseract支持多种语言,你可以从Tesseract的官方GitHub页面上找到相应的语言数据文件。下载完成后,将其放置在合适的位置。 4. 现在,你可以在命令行中使用Tesseract命令来进行OCR识别了。例如,你可以使用以下命令来识别一张图片中的文字: ``` tesseract image.png output -l eng ``` 这个命令将会将名为image.png的图片中的文字识别并保存到名为output.txt的文本文件中。`-l eng`参数指定了使用英语语言进行识别。 5. 如果你想在编程中使用Tesseract-OCR,可以选择适合你编程语言的Tesseract库或API。Tesseract提供了多种语言的接口,如Python、Java、C++等。你可以在Tesseract的官方文档中找到相应的使用方法和示例代码。 希望以上信息对你有所帮助!如果你还有其他问题,请继续提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT.BOB

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值