在使用ABBYY FineReader PDF 15进行OCR文字识别之前,要想快速获得准确的识别效果,需要根据要识别的文件类型以及复杂度,在“设置”里对OCR选项进行设置。
点击菜单栏右侧的“齿轮”按钮,或者快捷键“Ctrl + >”打开“设置”界面,并在“设置”界面选择“OCR”选项。
图1:OCR选项界面
- PDF识别模式
所谓PDF识别模式实际是在使用OCR识别PDF文件的时候,针对PDF文件里的内容类型采用的模式。
PDF文件的内容有两种类型:一种是图形,图形里的文字是不可被选择的;一种是文字可被选择和编辑的,大多从Word等可编辑的文件转换过来的。
图2:PDF中的两种类型的内容
针对上述两种类型的内容,ABBYY FineReader PDF 15软件提供了三种识别模式:
- 使用OCR
主要针对不可编辑的图片而言。它在OCR识别时创建一个新图层,放置从图片上识别出来的文字,使该文字可以被编辑。在PDF编辑器界面中,选择“文件”-“识别文档”-“识别文档”,对图片进行OCR识别模式后,就可以对图片上的文字进行编辑了。