虽然说ABBYY FineReader PDF 15 文本识别的智能化水平相当高,但也顶不住渣渣的拍摄水平。由于拍摄条件所限,拍摄的图像可能会出现倾斜、歪曲、包含弧度、光线暗等问题。
当我们对这些拍摄缺陷较多的图像进行文本识别时,就可能会出现区域划分错误的问题,比如将文本区域划分为图片、表格等,影响后续文本识别的准确度。在本文中,我们会学习如何对这些错误的区域进行修正,以提高识别的准确度。
一、使用OCR编辑器功能
首先,ABBYY FineReader PDF 15的区域识别功能属于智能OCR文字识别的功能,因此,需要单击“在OCR编辑器中打开”选项,打开指定的图像文件。
图1:在OCR编辑器中打开
待图像载入完成后,ABBYY FineReader PDF 15会自动开启智能识别程序。如图2所示,由于图像拍摄时有点倾斜,导致红色箭头指示的文字出现了一些识别失误,被识别为图片区域了,需手动修正一下。
图2:自动识别区域
二、手动绘制区域
在手动绘制区域前,我们需要先删除当前的区域属性。具体的操作是,如图3所示,右击区域,并在其快捷菜单中选择“删除”。
接着,就可以重新手动绘制区域。