tesseract-orc安装

转自 http://blog.duteba.com/technology/article/105.htm

1、先安装leptonica
提示缺少leptonica not found

wget http://www.leptonica.com/source/leptonica-1.69.tar.gz
tar zxvf leptonica-1.69.tar.gz 
cd leptonica-1.69
./configure
make
make install
#安装到默认路径,设置prefix,还得改lib

 

2、安装tesseract-orc

wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.grc.tar.gz
tar zxvf tesseract-ocr-3.02.02.tar.gz 
cd tesseract-ocr
./configure --help
./configure --prefix=/usr/local/tesseract-orc
#将leptonica.so软连接进来
ldd ./tesseract 
whereis liblept.so.3
cd lib
ln -s /usr/local/lib/liblept.so.3 liblept.so.3

 

3、安装语言包

wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
tar zxvf tesseract-ocr-3.01.eng.tar.gz 
cd tesseract-ocr-3.01.eng
cp -r tessdata/ /usr/local/tesseract-orc/share/
如需识别汉字,请自行查找中文包

 

4、体验

cd /usr/local/tesseract-orc/bin/
sz Code.png
./tesseract Code.png Code -l eng
#命令 图片路径 生成text文件路径 -l 语言包
more Code.txt 

 

5、效果:



下载附件:Code.txt

 

6、后记:

规整的识别率较高,图片稍加变化则识别效果较差。将图片去色处理和放大图片后识别能有效的提高识别率。

References:

1. http://www.linuxidc.com/Linux/2011-07/38728.htm

2. http://blog.csdn.net/jinxinliu1/article/details/42677589

3. http://www.eefocus.com/winter1988/blog/13-03/292209_03d5b.html

4. http://blog.csdn.net/yasi_xi/article/details/8763385

5. http://hilojack.sinaapp.com/?p=866 验证码识别工具-tesseract

6. http://huaidan.org/archives/2085.html 如何识别高级的验证码

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值