php tesseract,PHP ocr:用Tesseract OCR进行文字识别

系统环境:centos7

安装tesseract:

yum-config-manager --add-repo https://download.opensuse.org/repositories/home:/Alexander_Pozdnyakov/CentOS_7/

sudo rpm --import https://build.opensuse.org/projects/home:Alexander_Pozdnyakov/public_key

yum install tesseract

yum install tesseract-langpack-deu

安装php拓展包:

composer require thiagoalessio/tesseract_ocr

注意,php需要开启system函数才能正常使用拓展

使用如下:

require ('./vendor/autoload.php');

use thiagoalessio\TesseractOCR\TesseractOCR;

$ret = (new TesseractOCR('./text.png'))

->run();

var_dump($ret);

这边,我的测试图片是:

f8b53012b078703d14dcad979893d52d.png

输出效果如下:

2269ab2337ddb4d550f92f0985484352.png

这时候,是无法识别中文的,我们安装下英文,中文繁体,中文简体 识别库。

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/4.00/chi_sim.traineddata

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata

其他语言包可以到这边查找:

https://tesseract-ocr.github.io/tessdoc/Data-Files#data-files-for-version-400-november-29-2016

然后移动库到我的安装目录,也就是

cp/mv *.traineddata /usr/local/share/tessdata/

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值