Tesseract-ocr开发经验总结

本文总结了Tesseract OCR的环境搭建问题,包括leptonica库缺失、编译错误和运行时问题。此外,还分享了高效生成tif和box文件的方法,解决训练过程中遇到的FAILURE错误,以及如何处理多种字体训练和误识别问题,提供了实用的解决技巧。
摘要由CSDN通过智能技术生成

环境搭建的问题总结

前言:除非特殊需要,或者系统不支持,否则尽量避免使用源码安装,不然可能会在环境搭建这一步浪费大量时间。即使能正常使用了,也可能在后续的使用中因为各种各样的问题来重走这一过程,为避免这一情况的发生,即使tesseract能正常使用了,也请通过tesseract -v来确认自己需要的库都已经成功被tesseract找到。

一、configure提示leptonica library missing

configure输出(最后几行):

checking for leptonica... yes
checking for pixCreate in -llept... no
configure: error: leptonica library missing

我们看到checking for leptonica... yes,那么leptonica是安装成功的,但是却没有找到lib,那么我们通过环境变量和configure参数让它找到
export LIBLEPT_HEADERSDIR=/usr/local/include
./configure --enable-shared --with-extra-libraries=/usr/local/lib
(使用–enable-shard原因见下)

二、make时提示各类undefined symbol

情况有两种

(1)各类依赖安装不完全

If they

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值