档案数字化中OCR的运用

最新推荐文章于 2024-07-26 13:24:37 发布

wangqifeng10_16

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量221

点赞数

文章标签：档案手写识别人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangqifeng10_16/article/details/117770576

版权

档案数字化中OCR的运用

信息时代，档案数字化已成为今后一段时期档案工作的重中之重，纸质档案扫描工作在各地如火如荼地进行。然而，扫描所产生的电子档案实际上只是以图像形式存在的文件，而非真正意义上的文本文件。也就是说，计算机只认识档案的外表，却不认识其内在文字。用户通过计算机只能看到档案的原貌，却不能对其中的内容进行引用、检索等操作，这无疑对将来的电子档案利用工作造成了很大的不便。考虑到档案用户的利用需求，若要得到真正文本形态的电子档案，使档案数字化工作更加有效、更加彻底，便要应用到OCR技术。

OCR的工作流程为影像输入、影像前处理、文字特征抽取、比对识别、人工校正、最后将识别结果输出保存。OCR技术相对于传统的手工录入方式来说，具有强大的优势。首先，OCR文字识别的速度远快于手工录入, OCR还节省了大量人力资源，优化了资源配置，使人员分配于更加有意义的工作

云脉文档识别SDK适用于高拍仪、扫描笔、档案数字化加工等行业的合作伙伴集成开发,不但适用于印刷识别且适用于手写识别。

准确——识别率高达97%以上
快速——800万中文识别时间小于3秒
简单——企业可将该识别服务部署在自有服务器上（云服务器或本地服务器）
通用——支持APP、客户端、浏览器、微信端、扫描仪、高拍仪等多种途径调用识别

创新著录标引方式

OCR技术提供了一种新的著录方式，使档案条目通过计算机录入成为可能。工作人员可以直接从OCR后的全文中找到著录项：如题名、文号、责任者等复制粘贴到目录数据库的相应字段中去。

实现真正的全文检索

实现真正的全文检索自然离不开OCR技术，因为只有将扫描图像中的文字变成

　　文本格式，才有可能对其中的文字进行逐字检索。

支持双层PDF和OFD技术
优化图像质量，对图像进行纠偏、去污处理，调整亮度,对比度使图像更美观。

在线体验：http://www.yunmaiocr.com/

手机h5访问地址：http://www.aipim.cn/docs

QQ联系813251022

wangqifeng10_16

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
档案数字化中OCR的运用

档案数字化中OCR的运用信息时代，档案数字化已成为今后一段时期档案工作的重中之重，纸质档案扫描工作在各地如火如荼地进行。然而，扫描所产生的电子档案实际上只是以图像形式存在的文件，而非真正意义上的文本文件。也就是说，计算机只认识档案的外表，却不认识其内在文字。用户通过计算机只能看到档案的原貌，却不能对其中的内容进行引用、检索等操作，这无疑对将来的电子档案利用工作造成了很大的不便。考虑到档案用户的利用需求，若要得到真正文本形态的电子档案，使档案数字化工...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。