转自:http://lxy.me/centos-compiler-install-tesseract3-0-x-version.html
Centos下编译安装TESSERACT3.0.x版本
因为centos自带的低版本TESSERACT无法识别中文,所以我们来说说如何在centos下编译安装TESSERACT的最新版本。
1.首先我们来安装TESSERACT所需要的依赖库leptonica
1 2 3 4 | wget https://leptonica.googlecode.com/files/leptonica-1.69.tar.gz tar -zxvf leptonica-1.69.tar.gz cd leptonica-1.69 ./configure; make; make install |
2.编译安装TESSERACT的最新版本
1 2 3 4 5 6 7 | cd .. wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz tar -zxvf tesseract-ocr-3.02.02.tar.gz cd tesseract-ocr ./autogen.sh ./configure make; make install |
3.安装中文和英文的识别库
1 2 3 4 5 6 | cd .. wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz tar -zxvf tesseract-ocr-3.02.eng.tar.gz wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.chi_sim.tar.gz tar -zxvf tesseract-ocr-3.02.chi_sim.tar.gz mv tesseract-ocr/tessdata/* /usr/local/share/tessdata/ |
如果需要其他语言的识别库,请访问TESSERACT的下载页下载。