深延科技:基于深度学习的智能OCR识别技术大有可为

智能OCR技术作为人工智能领域的重要原子能力之一,在行业转型过程中发挥作用。近年来,移动互联、大数据等新技术飞速发展,倒逼传统行业向智能化、移动化的方向转型。这一大趋势也促使传统OCR技术不断向智能OCR升级,以满足更复杂、更高要求的任务需求。

随着深度学习的融入,实现了OCR对复杂文本的识别,即智能OCR识别。同时配合其他信息化手段的综合应用,使智能OCR具备移动端适配、多任务检测、整行识别、图像分割定位和分类等功能,应用场景更加广泛,在图书情报领域中的图书文本和卡证识别会更高效。

01 传统OCR识别技术缺陷渐露

光学字符识别(Optical Character Recognition,OCR)指自动识别图像中的文字内容,属于人工智能机器视觉领域的一个重要的分支,即把文本、卡证等载体上的文字通过光学等技术手段转化为计算机认识的电子化数据。传统OCR识别采用统计模式,处理流程较长,包括图像的预处理、二值化、连通域分析、版面分析、行切分、字切分、单字符识别和后处理等步骤。典型的传统OCR识别流程如图1所示。

图1 传统OCR识别技术流程

传统OCR识别方法存在诸多弊端,汇总如下:a)在进行版面分析时,使用大量的规则,导致程序维护成本很高。b)行业域分析完全依靠图像二值化得到的二值图,对于扫描文档效果尚可,面对手机拍摄和高拍仪取

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值