最近在用tesseract,遇到了一些问题,记录一下
tesseract安装,可以直接看git教程:https://github.com/tesseract-ocr/tesseract
要装各种依赖 装leptonica 版本对照。
Tesseract | Leptonica | Ubuntu |
---|---|---|
4.00 | 1.74.2 | Must build from source |
3.05 | 1.74.0 | Must build from source |
3.04 | 1.71 | Ubuntu 16.04 |
3.03 | 1.70 | Ubuntu 14.04 |
3.02 | 1.69 | Ubuntu 12.04 |
3.01 | 1.67 |
我先装了4.00,装好对应的leptonica以后装tesseract,装完以后调用api接口,发现不支持whitelist白名单功能,查了一下发现4.00版本tesseract这个功能取消了。
没办法有需求。只能重新装3.05,然后装对应的leptonica
安装tesseract make的时候报错 pixReadMemFromMultipageTiff' pixReadFromMultipageTiff相关的
是因为leptonica和tesseract版本不一致的错。
输入命令:tesseract -v 查看下版本。
tesseract 3.05.01
leptonica-1.74
libjpeg 8d (libjpeg-turbo 1.4.2) : libpng 1.2.53 : libtiff 4.0.6 : zlib 1.2.8
我之前下载的tesseract3.05.01安装的时候,tesseract 3.05.01
安装对应的leptonica-1.74,发现总是报这个错,查了下版本才发现tesseract是3.04.又下载了3.05才成功安装了
编译自己工程的时候报错://usr/local/lib/libtesseract.so: undefined reference to `pixReadMemFromMultipageTiff' //usr/local/lib/libtesseract.so: undefined reference to `pixReadFromMultipageTiff'
解决方法:sudo apt-get remove libleptonica-dev
好像还有别的错误是:报错c++11 -gnu++ 相关的
解决:-I/usr/local/include -I/home/dasein/local/include/tesseract -L/home/dasein/local/lib -llept -ltesseract -std=c++11 -std=gnu++0x