Android挖坑之路——初探OCR

有些时候明知道是坑,你还必须得往下面跳。领导昨天提了一个需求,以后智能化登机,必须通过OCR识别所有,然后明知道这是坑,虽然这个需求是肯定需要的,但是已目前的实现技术,太难。。。

百度OCR,第一个弹出tesseract这个库,好吧相信google,采用这个库,githbub地址。但是看了下,基本移动版不可用,于是继续百度tesseract,发现了专门的移动版的tesseract,github地址

这个移动版也是有点蛋疼的,首先把整个项目clone下来,然后没有装NDK的同学们,必须装NDK,并且配置NDK环境变量,新换了5K的IMAC配置这个东西让我哭了,还有github上面给的命令基本上是错误的。

当你配置好环境变量以后,命令行进入到根目录下面的tess-two目录,然后进行ndk-build命令,进行ndk打包,这个过程漫长无比,20M的网速打包了尽两个小时,打包完成以后,就有各个版本的so文件了。

好的把jar包和so文件放到自己的项目中吧,然后实现TessBaseAPI这个类就行了。但是,但是,但是,重要的话说三遍,实现这个类的前提是你必须有语言包,语言吧又要去第一个地址去下载,ressdate这个文件夹下面,一个G的内容,好吧,我只要中文和英文,就找了下eng开头的文件,总共20Mb,放到SD卡下面,然后用项目去读取里面的东西,去实现TessBaseAPI这个类,好的,可以用了。

但是扫描率极其蛋疼,呵呵了,一行字没有问题,多行字N个问题,只能竖着拍照,不能横着拍照,然后我就呵呵了,

百度了下提高识别率的方法,需要修改图片,白底黑字增加对比度,各种,好的,我用代码去实现了,然后,就没有然后了,稍微提高了一点,后面想了想,还是具体去提高它的字典吧,具体提高字典的方法在第一个地址里面有介绍,PC端通过软件去更改字典,增加字典以后在导入移动端,希望能成功。

最近下载分被朋友们用完了,大家还是花点分来下载吧,记得把tessdata文件夹放到sd卡根目录就行

OCR DEMO

评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值