centos7中如何安装tesseract-ocr和pytesseract

环境为centos7(win10:在https://blog.csdn.net/Owen_goodman/article/details/107016569)

tesseract-ocr 依赖 leptonica, 而安装leptonica前需要先安装常用图片库。
1、安装依赖
1.1 安装g++

yum install gcc gcc-c++ make

1.2 安装autoconf automake libtool libjpeg-devellibpng-devel libtiff-devel zlib-devel

yum install autoconf automake libtool

1.3 安装常用图片库

yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

2、安装leptonica
下载leptonica

wget http://www.leptonica.org/source/leptonica-1.76.0.tar.gz

解压

tar -zxvf leptonica-1.76.0.tar.gz

cd 进入目录后依次执行:

./configure

编译源码

make
make install

编译完成后,增加如下三个变量:

vim /etc/profile
export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

3、安装tesseract-ocr
3.1 下载tesseract-ocr

git clone -b master https://github.com/tesseract-ocr/tesseract.git tesseract-ocr

如何使用git下载文件请飞:https://blog.csdn.net/Owen_goodman/article/details/107003647

此链接下载的是最新版,需要自找各种字库比较麻烦,建议:

3.04版本下载地址(网上找来的,里面还带有英文,简体中文字库):
网盘https://pan.baidu.com/s/1mj6YTIw
提取码是:95p5
解压完毕进入tesseract-3.04.00文件夹内依次执行:
root权限执行

./autogen.sh

./configure

make

make install

ldconfig

4、安装pytesseract
pytesseract的安装比较简单

pip install pytesseract

5、配置字库
以上执行完毕,/usr/local/share/下会出现 tessdata文件夹
将刚才百度网盘下载的tesseract-3.04文件夹内带的字库( eng.traineddata、chi_sim.traineddata)拷贝到/usr/local/share/tessdata。

以上配置完毕就可以在python文件中使用pytesseract进行验证码识别了。
 

cp chi_sim.traineddata /usr/local/share/tessdata
cp eng.traineddata /usr/local/share/tessdata
cp eng.traineddata.part /usr/local/share/tessdata

彩蛋:

# -*-encoding:utf-8-*-
import pytesseract
from PIL import Image

# 测试数字图片,准确率很高
image = Image.open("数字.jpg")
string = pytesseract.image_to_string(image)
print(string)

参考:

https://blog.csdn.net/lihuaidong1989/article/details/80990100
https://blog.csdn.net/pangyunsheng/article/details/79372845

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值