tesseract的基本简单使用

tesseract的 安装以及使用
一:tesseract 的安装
(1)Tesseract本身没有windows的安装包,不过它指定了一个第三方的封装的windows安装包,在其wiki上有说明,大家可直接到这个地址进行下载: https://digi.bib.uni-mannheim.de/tesseract/
下载后就是一个exe安装包,直接右击安装即可,安装完成之后,配置一下环境变量,编辑 系统变量里面 path,
记得一定要配置环境变量
(2)安装成功之后,win+r --》cmd——》进入dos命令窗口——》输入tesseract
如图:在这里插入图片描述
(3)安装Python的封装接口
1.pip install pillow
2.pip insatll pytesseract
只有前面两步成功了才可以执行第三步
二:在代码中的简单使用
import pytesseract
from PIL import Image
img=Image.open(‘5.png’)# 5.png是你将要识别的图片
img=img.convert(‘RGB’)
print(pytesseract.image_to_string(img))
三:在代码中使用时可能会遇到以下情况
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your path
解决方法:首先找到C:\Program Files\Python36\Lib\site-packages\pytesseract\pytesseract.py
然后将源码中的:
tesseract_cmd = ‘tesseract’
更改为:
tesseract_cmd = r’C:\Program Files (x86)\Tesseract-OCR\tesseract.exe’
再次运行之前的PY脚本,成功.

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Tesseract.js是一个基于Google开发的OCR引擎Tesseract的JavaScript库,可以在浏览器和Node.js环境中使用。React是一个由Facebook开发的用于构建用户界面的JavaScript库。在React应用程序中使用Tesseract.js可以使您的应用程序具有识别图像文本的能力。 以下是使用Tesseract.js在React应用程序中识别图像文本的详细步骤: 1. 首先,您需要安装Tesseract.js库。在您的React应用程序中,可以使用npm或yarn进行安装。使用以下命令进行安装: ``` npm install tesseract.js ``` 2. 接下来,您需要导入Tesseract.js库。您可以使用以下代码将其导入到React组件中: ```javascript import Tesseract from 'tesseract.js'; ``` 3. 然后,您需要创建一个函数,该函数将处理图像并将其传递给Tesseract.js以进行文本识别。您可以使用以下代码创建一个名为recognizeText的函数: ```javascript const recognizeText = async (image) => { const result = await Tesseract.recognize(image, 'eng'); return result.data.text; }; ``` 在上面的代码中,我们将image和'eng'作为参数传递给Tesseract.recognize()方法。image参数是要识别的图像,'eng'参数是要使用的语言。您可以根据需要更改这些参数。 4. 接下来,您需要在React组件中使用recognizeText函数。您可以在React组件的事件处理程序中使用它。例如,以下是一个名为handleImageUpload的事件处理程序,该处理程序将在选择图像时调用recognizeText函数并将结果存储在React状态中: ```javascript handleImageUpload = async (event) => { const file = event.target.files[0]; const reader = new FileReader(); reader.onloadend = async () => { const image = new Image(); image.src = reader.result; image.onload = async () => { const result = await recognizeText(image); this.setState({ text: result }); }; }; reader.readAsDataURL(file); }; ``` 在上面的代码中,我们使用FileReader读取选定的图像文件。然后,我们创建一个新的Image对象,并将其设置为从文件读取的结果。最后,我们在图像加载完成后调用recognizeText函数,并将结果存储在React状态中。 5. 最后,您可以在React组件的render方法中使用识别的文本。例如,以下是一个简单的render方法,该方法将识别的文本显示在屏幕上: ```javascript render() { return ( <div> <input type="file" onChange={this.handleImageUpload} /> <p>{this.state.text}</p> </div> ); } ``` 在上面的代码中,我们将handleImageUpload事件处理程序分配给文件上传输入。然后,我们使用this.state.text显示识别的文本。 这就是在React应用程序中使用Tesseract.js识别图像文本的基本步骤。您可以根据需要自定义这些代码以满足您的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值