Linux 安装tesseract-OCR详细步骤

说明:

        工作需求,需要安装Tesseract-OCR,以此文记录安装过程。


一,官方文档

tesseract 官方GItHub

二,编译安装
1,安装leptonica

Tesseract 必须使用 Leptonica 库 来打开输入图像,所以需要下载,安装,使用内置支持zlibpngtiff(用于多页 tiff)的 leptonica。

yum -y install autoconf automake libtool
yum -y install libjpeg-devel libpng-devel libtiff-devel zlib-devel

#下载包,如果长时间没反应,停掉重新下载。有点慢,可以在本地下载好再上传。
wget https://github.com/DanBloomberg/leptonica/r

### 在Linux系统上安装配置Tesseract-OCR #### 使用YUM包管理器安装Tesseract-OCR 对于基于Red Hat的发行版,如CentOS或Fedora,可以使用`yum`来快速安装Tesseract OCR及其开发库。默认情况下,通过这种方式安装的是版本5.3.0[^1]。 ```bash sudo yum install -y tesseract tesseract-devel ``` 这一步骤会自动处理依赖关系并完成软件的部署工作。 #### 升级已有的Tesseract-OCR安装 如果需要更新现有的Tesseract至最新版本,在执行上述命令之前可以通过搜索功能确认可用的更新: ```bash yum search tesseract yum install tesseract.x86_64 -y ``` 为了使Python程序能够调用Tesseract的功能,还需要额外安装Pytesseract模块以及任何必要的Python绑定: ```bash pip3 install pytesseract ``` 以上操作适用于希望简化流程而不必手动编译源码的情况[^2]。 #### 手动下载特定版本的Tesseract-OCR 当有特殊需求时可以选择指定版本的手动安装方式。可以从GitHub上的官方发布页面获取所需版本的压缩文件,并按照指示解压和构建项目。例如,要下载4.0.0版本可采用如下wget指令: ```bash wget https://github.com/tesseract-ocr/tesseract/archive/4.0.0.tar.gz tar -xf 4.0.0.tar.gz cd tesseract-4.0.0/ ./autogen.sh && ./configure && make && sudo make install ``` 同时记得也需单独下载Leptonica图像处理库以支持完整的OCR能力[^3]。 #### 获取最新的稳定版二进制文件 访问[Tesseract GitHub Releases](https://github.com/tesseract-ocr/tesseract/releases)[^4] 页面可以直接找到预编译好的二进制分发包链接,适合那些想要尝试最前沿特性的用户群体。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值