解决方案的基本思想是: '另存为'较高分辨率的图片文件(如tiff文件),然后再从图片文件创建pdf文件、进行OCR识别。 具体步骤如下: (以sample.pdf文件为例,假设文件有2页) [1] 打开sample.pdf-->文件-->另存为-->TIFF格式(这时存为sample_页面_1.tiff 和sample_页面_2.tiff 两个文件) [2] 打开Adobe Acrobat软件-->文件-->创建PDF-->从文件-->找到sample_页面_1.tiff 打开-->文档-->OCR文本识别-->保存(默认sample_页面_1.pdf) [3] sample_页面_2.tiff的识别同[2] [4] 打开Adobe Acrobat软件-->文件-->合并-->合并到单个PDF (M)-->添加文件 (sample_页面_1.pdf 和sample_页面_2.pdf) -->合并-->保存 |
acrobat无法在本页面上执行ocr识别,因为:本页面包含可渲染的文本
最新推荐文章于 2024-04-07 16:24:58 发布