最近在进行Python数据爬虫方向的研究,使用到了与图像识别相关的一些功能,这样就会使用到图像识别的重要工具Tesseract。下面就在CentOS环境下安装和配置Tesseract的工作环境进行讲解。查阅了网上很多资料,现将自己的安装和测试过程记录如下:
1. 安装依赖库leptioncal库
1.1 进入供存放下载文件库的目录:执行wget http://www.leptonica.com/source/leptonica-1.72.tar.gz ,出现如下图所示软件下载界面:
后顺序执行下面四个指令:
1.2 执行解压指令 tar -xvf leptonica-1.72.tar.gz;
1.3 进入leptonica-1.72目录,执行配置指令 ./configure
1.4 执行编译指令 make
1.5 执行安装指令 make install