ocr之多字库联合使用

        之前在网上看到有很多OCR的相关资料,自己训练字库的资料也很多,但是关于训练字库后的多自字库联合使用资料则少之又少,其实在OCR3.02出来之后就已经支持多字库联合使用了,故记录下来,希望能对大家有所帮助!

1.首先在github上下载最新的项tess-two.,地址为:https://github.com/rmtheis/tess-two;

2.如果电脑没安装NDK的还需要下载ndk,因为tess-two是靠ndk编译的地址:https://dl.google.com/android/ndk/android-ndk-r8e-windows-x86.zip

安装ndk后执行一下命令:

[plain] view plaincopy
  1. cd tess-two  
  2. ndk-build  
  3. android update project -t 1 --path .  
  4. ant release  
  5.   
  6.   
  7. cd ..  
  8. cd eyes-two  
  9. ndk-build  
  10. android update project -t 1 --path .  
  11. ant release  

3. 调用tesseract识别图片

      eclipse里面导入编译好的android project,共三个项目,tess-two, tess-two-test 以及eyes-two。其中tess-two和eyes-two为android lib项目,供其它项目引用。tess-two封装Tesseract的Android API,eyes-two封装leptonica的Android API。tess-two-test为OCR的测试,先读一下TessBaseAPITest.java的代码,了解API的使用方法。
[java] view plaincopy
  1.        private static final String TESSBASE_PATH = "/mnt/sdcard/tesseract/";  
  2. private static final String DEFAULT_LANGUAGE = "eng";  
  3. private static final String CHINESE_LANGUAGE = "chi_sim";  
  4. private static final String CHINESE_CUSTOM = "custom";//自定义字库
  5.   
  6. TessBaseAPI baseApi = new TessBaseAPI();  
  7. baseApi.init(TESSBASE_PATH, CHINESE_LANGUAGE);  //单字库使用
  8. baseApi.init(TESSBASE_PATH, CHINESE_LANGUAGE+CHINESE_LANGUAGE); //多字库使用
  9. baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO);  
  10. baseApi.setImage(params[0]);  
  11.   
  12. // Ensure that the result is correct.  
  13. final String outputText = baseApi.getUTF8Text();  
  14. baseApi.end();  
最后自己在tess-two-test项目里加个Activity测试下就行了。

注:1.多字库的联合使用必须在ocr3.02版本以上才能实现,3.01是支持的,其次测试的时候数据放在手机的根目录的tessdata下。

      2.代码:http://download.csdn.net/detail/u010897392/8649197;

      3.自定义字库请看另一篇文章:http://blog.csdn.net/u010897392/article/details/45339301

4.如有问题,可留言讨论,大家共同进步!

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值