Android OCR 之 tesseract

本文介绍了如何在Android中使用tesseract进行OCR识别,包括下载、编译tess-two库,以及如何在项目中集成和使用TessBaseAPI进行文字识别,特别提到在识别12306验证码时的性能表现。
摘要由CSDN通过智能技术生成

Android OCR 之 tesseract

OCR属于CV的范畴,也就是计算机视觉,目前来看,除了opencv这个龙头老大,也就是hp开发的tesseract比较好用,虽然年头比较长了,但现在归google维护并托管在google code上了。

 

现在有android版本的
地址:http://code.google.com/p/tesseract-android-tools/

这个版本得自己git 三个库 leptonica  tesseract  libjpeg ,我自己是编译成功了,但测试的时候native层总是crash。

 

于是发现了tess的android的另一个分支 tess-two

推荐linux上编译

 

一、下载&编译

1、首先下载tess-two

git clone git://github.com/rmtheis/tess-two tess


2、进入 tess目录,里面有三个项目,我们只需要进入tess-two就可以直接编译了

cd tess/tess-two
ndk-build


 3、编译好后,将src下的两个包以及libs导入到自己的项目就可以用啦

这里把我我把编译好后的东西放出来,用的话不用再编译了

下载:tess-two.zip

 

二、使用

tesseract 使用了 leptonica的图像处理库,对于图像处理还是比较强大的

Android官方地址:tesseract-android-tools

但它必须要一个匹配库,即tessdata,我们可以从官方拷贝,在前面git的项目里面tesseract源码目录有现成的tessdata可以用,对于中文,google code上也有下载,当然也可以自己训练不同语言的tessdata。

包leptonica的类我们不必使用,只要使用tess包的类就行了

TessBaseAPI

使用时,首先创建TessBaseAPI对象

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值