mac 安装tesseract、pytesseract, 实现图片里文字的识别

本文介绍了mac环境下如何安装tesseract OCR引擎和pytesseract Python库,包括不同安装选项、基本命令用法及语言库下载。通过pytesseract与PIL的结合,实现图片中的文字识别。
摘要由CSDN通过智能技术生成

一, tesseract-OCR的介绍

1,tesseract-OCR是一个开源的OCR引擎,能识别100多种语言,专门用于对图片文字进行识别,并获取文本。但是它的缺点是对手写的识别能力比较差。
2,用tesseract可以识别的图片中字体,主要有以下一些特点:

  • 使用一个标准字体
  • 可以使用复印或者拍照,但是必须字体要清晰,没有痕迹
  • 图片里没有歪歪斜斜的字体
  • 另外没有超出图片中的字体,也没有残缺的字体

二, mac tesseract-OCR的安装

1,安装有四种方式:

  • brew install --with-training-tools tesseract //安装tesseract, 同时安装训练工具
  • brew install --all-languages tesseract //安装tesseract,同时它还会安装所有语言
  • brew install --all-languages --with-training-tools tesseract //安装附加组件
  • brew install tesseract //安装tesseract,但是不安装训练工具,我选择这种方式进行安装

2,安装完tesseract后,进行测试:

  • tesseract -v
    在这里插入图片描述
  • tessera
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值