OCR人工智能与档案管理方案

2013年以来,在国家档案局大力实施“存量数字化、增量电子化”的战略背景下,纸质档案数字化副本大量产生。全国各级档案馆(室)存量档案数字化工作成效显著,数字化比例大幅提高,很多档案部门已完成全部馆藏档案的数字化工作。截至2019年年底,全国各级综合档案馆馆藏档案数字化副本容量已达1407.8万GB(吉字节)。

当前,档案OCR工作已全面启动,相关标准规范已适时出台。部分地区档案部门在完成纸质档案数字化工作的基础上,纷纷开展了档案OCR工作。也有一些档案部门在开展档案数字化工作的同时,同步开展了档案OCR工作。为规范相关工作的开展,国家档案局因势利导,于2019年12月发布《纸质档案数字复制件光学字符识别(OCR)工作规范》,规定了纸质档案数字复制件OCR工作的组织、实施和管理要求,确定了开展档案OCR工作的总体原则、工作流程、质量规定等。基于此,档案部门相关工作取得了大量成果,未来档案OCR将融入更广泛、更深层次的档案工作中。

近年来,随着计算机视觉、自然语言理解、知识图谱等人工智能技术在OCR中的实际使用,OCR的性能和效率都得到了很大提升。通过深度学习的自适应学习驱动方式,能够更好地应对传统OCR产生的一些问题,简化参数预处理的流程,实现端到端的处理,提高OCR识别率。目前,基于人工智能技术的OCR在简体印刷文字方面的识别率已达98%以上。

人工智能OCR技术还能应用于具有多样性和复杂性的识别场景。如,不同大小、字体、颜色、亮度、对比度的文字,排列和对齐方式不相同的文字,图像的非文字区域与文字区域存在相似的纹理,低对比度、模糊断裂、残缺文字等。因此,人工智能OCR不仅能应用于文档的识别,还可应用于自然场景文字图像的识别。此外,人工智能OCR还能提高工作效率、节省大量成本。

基于此,将人工智能OCR应用在档案工作中,具有重要的作用和意义,必将成为支撑档案行业数字转型、智能升级、融合创新的重要基础。

————————————————
版权声明:本文为CSDN博主「Tel-18519103264」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ZsHua_18519103264/article/details/119271686

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值