essbase数据库 linux,一步一步教你如何在android使用tesseract识别文字(一)

该博客介绍了如何在Android平台上利用开源OCR引擎Tesseract及其Android实现tess-two进行文字识别。首先,通过GitHub克隆tess-two源码,并在Linux环境下使用NDK进行编译。接着,展示了简单的Android OCR程序的实现步骤,包括初始化TessBaseAPI、设置字典和识别图片。最后,获取并结束识别过程。
摘要由CSDN通过智能技术生成

Tesseract是一个HP和google先后维护的开源OCR(ocr,optical character Recognition)引擎,3.0以后已经支持中文识别.如何在android上使用它呢,那就不得不提另一个开源项目tess-two,tess-two是一个在android上使用tesseract的实例,tess-two中有三个主要目录:

eyes-two 对leptonica的封装

tess-two-test ocr的测试代码

tess-two 对Tesseract的封装

下载tess-two源码

首先,将tess-two代码从github上clone下来:(也可知直接从这个地址下载)

git@github.com:rmtheis/tess-two.git

克隆下来后,还需要ndk编译,建议linux下编译,只需要下载ndk就行了,windows下还要下载安装sygwin

使用ndk编译tess-two

分别cd进tess-two和eyes-two去编译项目

cd tess-two

ndk-build

cd eyes-two

ndk-build

简单的调用示例

简单的调用识别,只需要使用eclipse导入tess-two中的tess-two就行了,然后新建工程,引用这个library.

//sd卡路径

private static final String SD_PATH=Environment.getExternalStorageDirectory();

//字典名

private static final String DICTIONARY="/custom";

@Override

protected void onCreate(Bundle savedInstanceState) {

super.onCreate(savedInstanceState);

setContentView(R.layout.activity_main);

TessBaseAPI baseApi = new TessBaseAPI();

//记得要在你的sd卡的tessdata文件夹下放对应的字典文件,例如我这里就放的是custom.traineddata

baseApi.init(SD_PATH, DICTIONARY);

baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO);

//记得要在对应的文件夹里放上要识别的图片文件,比如我这里就在sd卡根目录放了img.png

baseApi.setImage(new File(SD_PATH+"/img.png"));

final String result= baseApi.getUTF8Text();

//这里,你可以把result的值赋值给你的TextView

baseApi.end();

}

如上,一个简单的android ocr程序就完成了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值