扫描文档SDK ocr识别技术

档案、合同、书刊、报纸、资料等印刷打印出版物的扫描图像云OCR识别利器

【产品介绍】

近期推出的文档OCR云识别产品,可以将过去单机低效率的转换工作,放到云端服务器进行处理,这样可以实现企业集团级别的应用;当企业部署了这套系统之后,可以将各分支机构的文档、资料的转换换工作便携的搬到云端处理,这样既节省了人工消耗、机器维护损耗也能满足全集团级别的图片的OCR功能应用。该系统能够快速地、大批量的、自动的将印刷的文档转化为可供阅读和可编辑的高质量电子文档,进而将电子文档应用到各类数据库、电子出版物、数字图书馆、网络资源等新型知识管理资源的建设和应用,是集团数字信息化新里程碑不可或缺的重要组成部分。

【主要功能】

文档OCR云识别系统核心引擎

内置高性能文字识别引擎,中文识别率达99.8%以上。英文、繁体中文识别率稳居世界领先水平;识别语种支持中文简体、中文繁体、、

文档OCR云识别系统UNICODE编码

采用超大字符集的UNICODE国际编码标准、支持目前市面上最全的字符识别。

文档OCR云识别系统XML技术

文档OCR云识别系统基于开放式的XML数据结构,支持第三方用户方便地进行文档数据的转换、迁移和再利用。

文档OCR云识别系统文段还原

文档OCR云识别系统强大的纸张版面分析算法,包括横排文本,竖排文本,文段段落分析,可以最大限度的计算输出的识别结果与原文档的文段保持一致,这样识别结果得到也会是近似原文档格式的TXT文档内容。

文档OCR云识别系统图片格式

文档OCR云识别系统支持导入识别JPG、TIF、PNG、GIF、BMP等图片,导入的图片像素精度达到标准程度(200dpi以上)识别率和识别速度都能满足使用者的需要;其中多图TIF支持识别,多图的PDF文件也支持识别。

文档OCR云识别系统识别速度

文档OCR云识别系统识别一张A4大小的图,所耗费时间是500-700毫秒,根据图片内容的复杂情况而不同。

文档OCR云识别系统支持系统

文档OCR云识别系统可以部署在Linux/Windows的32位/64位系统中;支持WebService以及Java Servlet接口调用;支持的WEB应用服务器系统环境包括Tomcat、Jboss。

【识别结果说明】

输出的识别结果有XML、TXT两种文档格式,XML格式支持直接下载使用。

————————————————
版权声明:本文为CSDN博主「ZsHua_18519103264」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/ZsHua_18519103264/article/details/82226144

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值