ABBYY FineReader Server 与杂乱无章的较量。我们的解决方案如何去除重复内容,让商业文档井井有条?

ABBYY Recognition Server 已帮助库页岛、拉脱维亚、英国和其他国家/地区完成了图书馆资料与目录的数字化。此产品已推出很长时间,而这段时间内我们也一直在对它进行完善。我们增加了新功能,搭载最新一代智能 OCR 技术以提升产品能力,甚至给它取了一个新名字,叫做 ABBYY FineReader Server。也就是说,我们已经以 FineReader 品牌的名义,将所有文档识别、转换和编辑产品统一起来。

ABBYY FineReader Server 如今不仅可以帮助图书馆和档案馆完成资料的数字化,而且还能够辅助大型企业实现信息存储的精简。例如,FESCO Group 将发票和运货单数字化后发送至单一电子档案,以加快交易速度,而普华永道员工则直接通过手机将发票、合同及其他文档的照片转换为可搜索全文本 PDF 并发送至公司系统。美国的 Kantor & Kantor 律师事务所采用该解决方案,能够在数以千计的法庭判例页面中更快地找到相关信息。

本文将为您介绍 ABBYY FineReader Server 的几项新功能及其技术层面的实现方式,以及为何受到大公司的青睐。

根据 O'Reilly 的《2020 年数据质量状况》调研,多数大公司都会遇到企业信息方面的难题。例如,有 60% 的受访者表示企业中存在大量的信息来源和重复信息,有 49% 的受访者表示源数据的质量控制欠佳。问题还不止内容重复这么简单。信息变得陈旧,而大量过时的文件会拖慢信息搜索速度,导致企业系统运行拖沓、占用空间并直接抬高数据存储成本。这一幕不应该再在新的 DMS 或 ECM 系统上重演。

实际上,每位用户对此类问题均已见怪不怪。有时只要看看自己的桌面就能明白:是该摆脱杂乱无章、去拥抱井然有序了。再想想拥有数千名员工、数百万份文档的大公司的企业级存储,又该何去何从呢?

要应对此类挑战,也就是管理文档流、仅存储且仅按所需格式存储所需数据,智能信息处理技术可助您一臂之力。下面为您介绍 ABBYY FineReader Server 推出的几项新功能,这些功能可帮助您摆脱杂乱无章:

- 自动移除完全重复的信息;

- 文档预处理;

- 改善对最常用条形码(包括 ISBN、PDF417、Aztec 和二维码)的识别效果;

- 用于文件识别和转换的单一 Web 界面;

- 改善彩色图像的压缩效果。

完全重复信息:搜索与停止。

公司不管规模大小,一般都存有积压多年的电子档案。比如您的 SharePoint,随时间的推移积累了大量的文件。哪里存储了什么,如何才能快速找到所需的文档,有时甚至连当事人都搞不清楚。但这正是 ABBYY FineReader Server 所擅长的。通过“审计”模式,可查看库中所存储的文档及其数量。

首先&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值