尽管ABBYY FineReader PDF 15是一个识别度极高的OCR文字识别工具,但它在识别图片、PDF文件的时候还是会存在一定的遗漏和错误。其中,在识别表格的时候,有某些表格并不能完全识别出来。对于这种情况,很多小伙伴把识别的文件转换为Word文件后,再在Word软件中修改,这使工作量变得巨大。
实际上,在ABBYY的OCR编辑器中,通过调整对表格区域的识别,可以使表格的识别度达致百分百。下面小编通过一个实际的案例,讲述如何调整不能完全识别的表格。
首先,使用ABBYY Finder PDF 15软件打开一个通过扫描纸质表格生成的PDF文件。由于纸质表格的清晰度并不高,使到扫描形成的PDF文件的效果也不是很好,这会令ABBYY的OCR编辑器识别发生错误,这在实际使用中普遍发生的问题。
图1:打开一个PDF文件
点击“识别”按钮,选择“识别并在OCR编辑器中验证”。
图2:识别PDF文件
待识别结束后,在OCR编辑器界面中,检查右侧副本文件,发现表格并没有完全识别出来。例如:“登记号”左侧少了一条竖线;“非户籍学生……”缺失了左右两条竖线以及下面“签名”部分的表格都没有识别出来。此时注意,“保存格式”一定要选择“精确到副本”。