pytesseract安装教程

1.介绍

pytesseract是一个用于文本识别的Python库,它提供了方便的接口和功能,使得对图像中的文本进行识别变得简单和高效,pytesseract的特点和优势如下:

  1. 功能强大:pytesseract可以识别各种图像格式,如JPEG、PNG、BMP等,并且支持多语言识别。它使用Tesseract
  2. OCR引擎,该引擎在图像和OCR方面具有领先的技术和准确性。
  3. 简单易用:pytesseract提供了简单的API接口,使得开发者可以轻松地在其上进行图像文本识别。它还支持使用OCR引擎进行训练和自定义,从而满足特定的需求。
  4. 灵活性:pytesseract支持多种操作系统和环境,包括Windows、Linux、macOS等,并且可以在不同的开发环境中使用,如Jupyter、Notebook、PyCharm等。
  5. 高效性:pytesseract使用了多线程和GPU加速技术,可以快速地处理大量图像数据,提高识别效率。

2. 安装步骤

获取安装包

直接上链接:https://digi.bib.uni-mannheim.de/tesseract/
根据自己的要求选择版本
在这里插入图片描述

安装界面

  1. 选择语言,默认选英文就好
    在这里插入图片描述
  2. 一直点击下一步就好
  3. 选择安装路径
    选择路径
  4. 安装完成

配置环境

配置环境

检查安装成功

  1. 快捷键win + R,输入cmd进入命令行。
  2. 输入:tesseract -v回车
    命令行检查环境是否安装成功

3. 使用

使用命令行运行

  1. 准备图片,在E:test目录下有一张名为img.png的图片。
    在这里插入图片描述

  2. 在命令行中 先进入图片所在文件夹,输入tesseract 图片名 文件名,如下:
    在这里插入图片描述

  3. 结果如下:
    在这里插入图片描述

使用python代码运行

  1. 下载python环境和安装 pytesseract 包,这里不做过多讲解。

  2. python解释器地址\Lib\site-packages\pytesseract中找到pytesseract,py文件
    在这里插入图片描述

  3. 编写代码

    from PIL import Image
    import pytesseract
    
    # 加载图像文件  
    img = Image.open('img.png')  
    
    # 进行文本识别  
    text = pytesseract.image_to_string(img)  
      
    # 输出识别结果  
    print(text)
    
  4. 运行结果如下:
    在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

悟解了

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值