ABBYY FineReader Server 与杂乱无章的较量。我们的解决方案如何去除重复内容，让商业文档井井有条？

最新推荐文章于 2024-02-26 13:34:02 发布

ocr-developer

最新推荐文章于 2024-02-26 13:34:02 发布

阅读量459

点赞数

分类专栏： OCR ABBYY技术 NLP 文章标签： ABBYY OCR FineReader Engine SDK 自然语言处理

本文链接：https://blog.csdn.net/u014337082/article/details/122480723

版权

ABBYY Recognition Server 已帮助库页岛、拉脱维亚、英国和其他国家/地区完成了图书馆资料与目录的数字化。此产品已推出很长时间，而这段时间内我们也一直在对它进行完善。我们增加了新功能，搭载最新一代智能 OCR 技术以提升产品能力，甚至给它取了一个新名字，叫做 ABBYY FineReader Server。也就是说，我们已经以 FineReader 品牌的名义，将所有文档识别、转换和编辑产品统一起来。

ABBYY FineReader Server 如今不仅可以帮助图书馆和档案馆完成资料的数字化，而且还能够辅助大型企业实现信息存储的精简。例如，FESCO Group 将发票和运货单数字化后发送至单一电子档案，以加快交易速度，而普华永道员工则直接通过手机将发票、合同及其他文档的照片转换为可搜索全文本 PDF 并发送至公司系统。美国的 Kantor & Kantor 律师事务所采用该解决方案，能够在数以千计的法庭判例页面中更快地找到相关信息。

本文将为您介绍 ABBYY FineReader Server 的几项新功能及其技术层面的实现方式，以及为何受到大公司的青睐。

根据 O'Reilly 的《2020 年数据质量状况》调研，多数大公司都会遇到企业信息方面的难题。例如，有 60% 的受访者表示企业中存在大量的信息来源和重复信息，有 49% 的受访者表示源数据的质量控制欠佳。问题还不止内容重复这么简单。信息变得陈旧，而大量过时的文件会拖慢信息搜索速度，导致企业系统运行拖沓、占用空间并直接抬高数据存储成本。这一幕不应该再在新的 DMS 或 ECM 系统上重演。

实际上，每位用户对此类问题均已见怪不怪。有时只要看看自己的桌面就能明白：是该摆脱杂乱无章、去拥抱井然有序了。再想想拥有数千名员工、数百万份文档的大公司的企业级存储，又该何去何从呢？

要应对此类挑战，也就是管理文档流、仅存储且仅按所需格式存储所需数据，智能信息处理技术可助您一臂之力。下面为您介绍 ABBYY FineReader Server 推出的几项新功能，这些功能可帮助您摆脱杂乱无章：

- 自动移除完全重复的信息；

- 文档预处理；

- 改善对最常用条形码（包括 ISBN、PDF417、Aztec 和二维码）的识别效果；

- 用于文件识别和转换的单一 Web 界面；

- 改善彩色图像的压缩效果。

完全重复信息：搜索与停止。

公司不管规模大小，一般都存有积压多年的电子档案。比如您的 SharePoint，随时间的推移积累了大量的文件。哪里存储了什么，如何才能快速找到所需的文档，有时甚至连当事人都搞不清楚。但这正是 ABBYY FineReader Server 所擅长的。通过“审计”模式，可查看库中所存储的文档及其数量。

首先&#

最低0.47元/天解锁文章

ocr-developer

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ABBYY FineReader Server 与杂乱无章的较量。我们的解决方案如何去除重复内容，让商业文档井井有条？

ABBYY Recognition Server 已帮助库页岛、拉脱维亚、英国和其他国家/地区完成了图书馆资料与目录的数字化。此产品已推出很长时间，而这段时间内我们也一直在对它进行完善。我们增加了新功能，搭载最新一代智能 OCR 技术以提升产品能力，甚至给它取了一个新名字，叫做 ABBYY FineReader Server。也就是说，我们已经以 FineReader 品牌的名义，将所有文档识别、转换和编辑产品统一起来。ABBYY FineReader Server 如今不仅可以帮助图书馆和档案馆完成资
复制链接

扫一扫