ABBYY FineReader PDF 15通过OCR识别技术,能对不包含文字图层的图像文件进行文本识别,可以帮助用户更好地获取图像上的信息。
硬件条件许可的情况下,建议用户使用扫描仪器来获取图像。但如果没有扫描机,用户也可以使用相机拍摄来获得图像。只要操作的方法得当,相机拍摄的图像也能获得高质量的OCR识别结果。
图1:图像的识别
第一、相机的要求
为了获得更高质量的文档图像,以提高ABBYY FineReader PDF 15的文本识别效果,建议用户使用满足以下要求的相机(此建议仅供参考,如果条件不允许,普通相机也能拍摄文档图像,只是识别效果会不够好):
·针对A4纸大小的图像,其分辨率应达到500万像素
·可手动开启或关闭闪光灯
·最好可以有手动光圈控制、手动对焦功能
·配备光学变焦功能
·防抖功能或配备三脚架
以上的相机要求是基于保持光照充足、拍摄无抖动而建议的,接下来,具体看一下拍摄稳定性以及光照充足性对拍摄图像的影响。
图2:相机
第二、照明
拍摄时的光线条件会很大程度上地影响拍摄的照片质量。当光线充足时,照片的细节描绘也会更细致,清晰度会更高;反之,当光线不够时,照片就会显得模糊,细节损失大。对于一些文本比较多的图像,需要更好的光线条件。
如果可以的话,最好是使用自然的照明或者较大范围的人工照明,而不用相机自带的闪光灯。因闪光灯拍摄容易造成高光与阴影的负面效果。
如果你使用的相机,可以调整光圈值以及ISO值,建议设置较低的光圈值或者较高的ISO值。
图3:照明
第三、俯拍
关于拍摄角度,俯视的拍摄角度能够获得更好的正面图像呈现效果。俯拍的时候,相机的镜头应该与页面平行,并保持适当的距离,以50 - 60 厘米之间为宜。
图4:俯拍视角
第四、三脚架的辅助
拍摄照片时,最好开启相机的防抖功能,防止因为手部抖动造成图像的模糊。在光线不足的情况下,相机可能会花较长时间曝光,如果可以的话,最好使用三脚架来稳定拍摄。三脚架是拍摄图像时的防抖神器。
图5:三脚架
以上的相机拍摄建议,可以帮助用户更好地拍摄OCR识别用的图像文件。如果拍摄的图像存在着一些轻微的模糊、歪斜等瑕疵,ABBYY FineReader PDF 15 OCR文字识别软件也可应用OCR编辑器的图像预处理功能修正一些图像瑕疵。