Tesseract OCR安装与简单使用

Tesseract OCR安装与简单使用

1.下载Tesseract OCR

下载地址:https://digi.bib.uni-mannheim.de/tesseract/
在这里插入图片描述

2.安装Tesseract OCR

  • 双击安装程序,进入安装界面。
    在这里插入图片描述

  • 接受协议,下一步。
    在这里插入图片描述

  • 选择用户
    在这里插入图片描述

  • 选择组件

    • 如果电脑配置够好、网速够快,可以之间勾选”Additional language data(download)“,下载全部额外的语言数据。
      在这里插入图片描述

    • 直接全选的话,后面下载语言包需要很长时间,导致安装进度缓慢。可以点击“Additional language data(download)”旁边的”+“号,选择几种需要的语言包。
      在这里插入图片描述

  • 设置安装目录。点击”Next“。
    在这里插入图片描述

  • 点击”Install“。
    在这里插入图片描述

  • 等待安装完成。
    在这里插入图片描述
    在这里插入图片描述

  • 安装完成。点击”Finish“。
    在这里插入图片描述

  • 将目录添加到系统环境变量Path
    在这里插入图片描述

  • 查看版本信息

  tesseract -v

在这里插入图片描述

  • 查看已下载的语言包。
  tesseract --list-langs

在这里插入图片描述

3.文字识别程序编写

  • 安装pytesseract模块
pip install pytesseract

在这里插入图片描述

  • 示例1:
from PIL import Image
import pytesseract


# 添加tesseract的路径
pytesseract.pytesseract.tesseract_cmd = r'D:\software\Tesseract-OCR\tesseract.exe'
"""
image_to_string():如果识别英文或数字可以不必额外参数,如果识别其他语言则需要加上lang参数
lang='chi_sim'表示要识别的是中文简体
没有识别出来时,返回空白
"""
text = pytesseract.image_to_string(Image.open('test.jpg'), lang='chi_sim')
print(text)

test.jpg:
在这里插入图片描述
识别效果:
在这里插入图片描述

  • 示例2:

    test2.jpg:
    在这里插入图片描述
    识别效果:
    在这里插入图片描述

  • 示例3

    test4.png:
    在这里插入图片描述
    识别效果:
    在这里插入图片描述


参考文章:
  • 12
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦里逆天

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值