mac系统中安装Tesseract OCR

OCR 学名叫 Optical Character Recognition,意思是通过图像识别,识别照片中的印刷体的文字。OCR 只识别印刷体文字,但是不识别手写体文字。

1.Tesseract OCR

在Mac环境下安装Tesseract OCR(Optical Character Recognition)通常可以通过Homebrew包管理器进行。以下是安装步骤:

安装Homebrew

如果你还没有安装Homebrew,请访问Homebrew官网并按照页面上的说明安装。

1.1使用Homebrew安装Tesseract

  1. 打开终端(Terminal)应用程序。
  2. 在终端中输入以下命令以安装Tesseract:
brew install tesseract

这将下载并安装最新版本的Tesseract,同时可能还会安装一些依赖项。

安装语言包

要在Mac上下载Tesseract的简体中文语言数据包chi_sim.traineddata,你可以按照以下步骤进行操作:

下载语言数据包

安装语言数据包

  1. 找到Tesseract在Mac上的安装位置。通常情况下,如果你使用Homebrew安装,它可能位于
    /usr/local/Cellar/tesseract/版本号/share/tessdata
  2. 将解压后文件放置关系:
tessdata
chi_sim.traineddata
tessdata

验证安装

  1. 打开终端(Terminal)应用程序。
  2. 输入以下命令以验证是否已经正确安装了Tesseract和简体中文语言数据包:
tesseract --version

这将显示你当前安装的Tesseract版本信息。
3. 检查可用的语言列表:

tesseract --list-langs

如果一切正常,你应该能在输出列表中看到chi_sim。现在,你就可以使用Tesseract识别简体中文图像了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

githubcurry

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值