OCR在档案管理中实际应用

 人工智能OCR工作流程主要包括图像输入、文本检测、文本识别、人工确认、人工干预等。

    首先,将需要识别的纸质档案数字化副本图像单个或批量导入OCR系统中。

    其次,进行文本检测。文本检测主要是定位文字在数字图像中的位置,并进行位置标注。文本检测的方法主要有基于候选框的文本检测、基于语义分割的文本检测,以及基于两种方法的混合方法等。基于候选框的文本检测是先预生成若干候选框,之后再回归坐标和分类,最后经过NMS(非极大抑制)算法得到最终的检测结果;基于语义分割的文本检测是通过FPN(特征金字塔网络)直接进行像素级别的语义分割,并处理得到相关的坐标。

    再次,进行文本识别。文本识别主要是针对定位好的文字区域,识别文本的具体内容,并将图像中的一串文字转换为对应的字符。文本识别的算法可分为基于CTC(连接时序分类)技术的方法和基于注意力机制的网络模型两大类。其中,基于CTC技术的方法可以有效地捕获输入序列的下文依赖关系,同时能够很好地解决图像和文本字符对不齐的问题,但在自由度较大的手写场景下会出现识别错误。基于注意力机制的网络模型主要应用于卷积神经网络特征权重的分配上,并提高强特征的权重、降低弱特征的权重,在由图像到文字的解码过程中有天然的语义捕获能力。

    然后,进行人工确认。对OCR识别后的结果进行确认,判断是否出错。在人工确认过程中,可以采用后期批量处理等灵活性较强的方式。

    最后,进行人工干预,修正OCR识别结果中可能存在的错误。

    人工智能OCR可采用独立式或嵌入式等方式应用在档案数字化系统中。独立式是作为独立软件使用,或者通过应用程序接口(API)进行数据交互,不依赖于档案数字化系统。嵌入式是将OCR模块嵌入档案数字化系统,作为其功能的一部分,需要在设计开发档案管理系统时进行统一规划,或对已有的系统进行改造。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值