初试OCR软件

最近有一项很无聊的工作,要录入某本书上的文字,大概有两万字多。像我这样用拼音输入法的、且很少上网聊天的人,无疑是一项艰巨而痛苦的任务。幸好,偶是搞计算机的,知道有OCR软件,二话不说立刻上百度。几经搜索和对比,选择了咱们清华大学出的TH-OCR9(推荐去迅雷下载,速度快且完美破解)

软件的使用就不说了,很容易上手,关键是用于识别的图像素材。由于手头没有扫描仪,只能用相机拍。为了得到最好的识别效果,我尝试了好几种参数组合进行拍摄,最终找出了比较合理的方法,识别率大概为90%

首先最影响扫描效果的是光照,也即拍出来的照片所有文字的光照要均匀。当然相机无法和扫描仪相比,在照片的边缘肯定会有一点点阴影。解决方法是在书本的周围摆上台灯,最好有几台,从不同角度给纸张打光,再加上相机的闪光灯,可以基本保证均匀的光照。但是也不能太强的光线,否则由于纸张的反光效果,会导致部分文字过曝而变得模糊

其次是对焦问题。一般我们都是对准书本的中间进行对焦的,然而从识别的效果来看,你会发现中间的识别效果最好,基本100%,周围的就很差,什么原因呢?除了刚刚提到的周围纸张光照不足,还有一个问题就是边缘对焦模糊。缓解这个现象的方法当然就是加大景深了。尽量将光圈的f值调到最大,快门保持在1/60左右基本就可以了,然后把ISO调到最大以弥补小光圈带来的曝光不足,反正是白纸黑字,受ISO带来的噪点影响不大

最后当然就是记得把要拍的纸张压平了。虽然OCR软件可以处理文字的轻度扭曲(比如镜头边缘的球形失真),但还是尽可能的压平纸张比较好。哪怕用手压,只要不挡住文字,在扫描的时候手动选取文字区域就不会影响最终结果。

具体的扫描效果要看个人的相机和书本的排版,总的来说还是不错的,相信用扫描仪的话识别率可以更高

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值