在“识别文本”对话框中,选择“页面”下的一个选项。(可选)单击“编辑”打开“识别文本
- 设置”对话框,然后按需要指定选项。
2、识别多个文档中的文本
在 Acrobat 中,选择“文档”>“OCR 文本识别”>“使用 OCR
识别多个文件中的文本”。 在“页面捕捉多个文件”对话框中,单击“添加文件”,选择“添加文件”,“添加文件夹”或“添加打开的文件”。然后选择相应的文件或文件夹。 在“输出选项”对话框中,指定输出文件的目标文件夹、文件名首选项以及输出格式。 在“识别文本 - 设置”对话框中,指定选项,然后单击“确定”。
3、识别 PDF 包中组件 PDF 中的文本
在 PDF 包中选择一个或多个扫描的 PDF。 选择“文档”>“OCR 文本识别”>“使用 OCR
识别文本”。 在“识别文本 - 设置”对话框中指定选项。
OCR识别文本功能的使用
1.捕获扫描页面
通过Acrobat的“使用OCR识别文本”功能可以将扫描页面由图像转换成可搜索的PDF文档。Acrobat允许以3种格式捕获扫描页面:格式化的文本和图形PDF、可搜索的图像PDF(精确)以及可搜索的图像PDF(紧凑)。可搜索的图像PDF在PDF文档中将扫描图像放在前景中,而将捕获的文本放在不可见的背景层中。
捕获扫描页面的具体步骤如下所述:
(1)选择“文档>使用OCR识别文本>开始”命令,弹出“识别文本”对话框。
(2)选择要捕获的页面。
(3)单击“编辑”按钮,弹出“识别文本-设置”对话框,选择“OCR识别的主要语言”和“PDF输出样式”选项,然后单击“确定”按钮。
(4)单击“确定”按钮开始OC