使用ABBYY快速的识别图片和PDF文档上的文字

本文介绍了如何使用ABBYY FineReader PDF 15识别和编辑图像型PDF文档中的文字。通过OCR功能,可以将无法选取文字的PDF转换为可搜索、编辑的文本型PDF,便于复制和搜索内容。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

当我们在浏览使用PDF文档时,会发现有一些PDF文档是可以选取文字并进行复制搜索的,但也有一些PDF文档是无法进行文字选取的,这是为什么呢?

这是因为PDF文档包含了图像型与文字型两种类型。文字型的PDF文档可供搜索、选取与复制,而图像型PDF文档仅可浏览,不能进行搜索、复制等操作,需要借助专业的OCR文字识别软件,下面我们使用ABBYY FineReader PDF 15来完成文字识别。

图1:ABBYY FineReader PDF 15软件

一、图像型PDF文档

在使用浏览器打开图像型PDF文档时,我们是无法进行文本选取的,并且其右键快捷菜单中也不会包含复制等编辑选项。

图2:图片型PDF文档

而如果使用ABBYY FineReader PDF 15打开图像型PDF文档时,就可以使用其查看和编辑PDF文档功能,进行文档的文本识别。

图3:查看与编辑PDF文档

二、开启编辑模式

ABBYY FineReader PDF 15的PDF文档打开功能,不仅包含了图像型PDF文档的文本识别功能,而且还允许我们编辑文档中的内容。如图4所示,通过单击“编辑”按钮,即可开启软件的编辑模式。

图4:编辑模式

在编辑模式下,我们可以复制、剪切、删除、更改文档中的内容。

图5:复制功能

三、另存为文本型PDF文档

如果您希望在不开启ABBYY FineReader PDF 15的情况下,也能自由地复制、搜索PDF文档中的内容,可使用软件的另存为功能,将其保存为文本型的PDF文档。

具体的操作是,如图6所示,单击顶部的另存为快捷菜单,选择其中的“可搜索PDF文档”选项,即可将其保存为文本型PDF文档。当然,如果您希望编辑文档的内容,也可以将其另存为Word文档等可编辑文件类型。


图6:另存为可搜索PDF文档

保存后的可搜索PDF文档,如图7所示,既可自由地选取文本,也可以通过右键快捷菜单复制、搜索等。

图7:文本型PDF文档

四、小结

综上所述,图像型PDF文档能起到保护文档内容的作用,但如果要复制或搜索其中的内容,就需要借助专业的文本识别软件ABBYY FineReader PDF 15完成文本的OCR识别,才能进一步进行内容的选取、复制与搜索。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值