华为云鲲鹏云服务器系列的规格,#化鲲为鹏,我有话说#使用华为云鲲鹏弹性云服务器部署文字识别Tesseract...

分配的弹性云服务器规格:2vCPUs|4G|CentOS6.5 64bit

首先登录上华为云官网,在控制台找到分配的弹性云服务器复制IP,打开桌面上的XFce,执行如下代码,将EIP修改为IP:

LANG=en_us.UTF-8 ssh root@EIP

a2e300ee256045896e551a4d2122312d.png

输入密码,配置Tesseract环境所需要的依赖包,例如构建系统需要的Auto make,创建库的工具libtools、C++编译器、图片库等等

输入如下命令行进行相关依赖包安装:

yum install automake libtool gcc-c++ libjpeg-devel libpng-devel libtiff-devel -y

5dd995d5ec23cae955e023d397cbc4bb.png

leptonica是tesserart的依赖库,使用它可以实现tesserart识别串的编译

下载leptonica安装包,执行如下命令行:

wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/leptonica-1.78.0.tar.gz

45de02b90c6bb7a31e9157706a6a137b.png

解压安装包,输入以下命令行:

tar -xvf leptonica-1.78.0.tar.gz

1825e3f117bec982f511f709918f89d9.png

编译安装,先进入leptonica文件夹输入命令行:

cd leptonica-1.78.0

./configure --prefix=/usr/ && make -j4 && make install

c60f3db9c4dd97a189897c61435ffddc.png

配置leptonica所需要的环境变量:

进入:vim etc\profile

b4670f0b8ac386134612241e3ea8b6c7.png

进入文件后在键盘上按shift+G键,跳转到文档的底部,将光标移动到done下一行,输入i进入编写状态,将下面的代码输入进去

export PKG_CONFIG_PATH=/usr/lib/pkgconfig

6bb3634c4e986c2b11fc0045b93162e4.png

之后按esc退出编辑状态,输入:wq退出文档,输入下面的命令行进行个保存运行。source /etc/profile && ldconfig

9fd70e51f6b2794b45b9a590dff31c3e.png

配置tesseract

进入src文件,下载tesseract,输入如下命令行:cd /usr/local/src

wget https://sandbox-experiment-resource.obs.cn-north-1.myhuaweicloud.com/kunpeng-tesseract/tesseract-4.0.0.tar.gz

fad754a7f1dcb4f6ff855d2920e1c3ec.png

解压压缩包:

tar -xvf tesseract-4.0.0.tar.gz

162657589292e24a84c3ca7d51ae992f.png

打开文件夹进行编译安装,输入如下命令行:

cd tesseract-4.0.0

./autogen.sh && ./configure && make -j4 && make install

acd8a0af666b9fbdffec26b7deb50ec1.png

编译成功后,进入root账户下,下载英文语言包:cd /root

wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/eng.traineddata

37ed9c0d58f190d46684c9d26b3a0106.png

下载中文语言包:

wget https://sandbox-experiment-resource.obs-website.cn-north-1.myhwclouds.com/kunpeng-tesseract/chi_sim.traineddata

3395c3f620243b8ed708de001f72464b.png

tesserart识别语音包需要将语音包放置到“usr/local/share/tessdata”这个目录下一般与tesserart识别:cp eng.traineddata /usr/local/share/tessdata -r && cp chi_sim.traineddata /usr/local/share/tessdata -r

6979327415145a90df7fd02a198831bc.png

接下来让我们下载个鲲鹏文字图片来进行个测试吧:

wget https://portal-www-software.obs.cn-north-1.myhuaweicloud.com:443/kunpeng_chi.bmp

617ea7f4ab6333fca6265dd20f8947a6.png

执行以下命令让我们来查看下测试结果:

tesseract -l chi_sim kunpeng_chi.bmp res_chi && cat res_chi.txt

d2d295502a12764c10990d53a5a57275.png

接下来让我们测试下英文测试结果:

下载英文测试图片

执行如下命令行进行测试:

tesseract kunpeng.bmp result && cat result.txt

a00d6f422a9f5cb12cb3a07738507bcc.png

至此我们tesserart文字识别搭建完成!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值