很多人在编辑pdf文件时遇到过无法复制PDF中的文字而头疼不已。通常出现pdf无法复制文字的情况,除了加密的PDF文档(
PDF文件中的文字存在两种可能性:其一,文字型PDF,可能是以计算机字符代码的形式被包裹在文件中;其二,图像型PDF,可能只是一个页面图像中的像素组成的线条,没有字符代码信息。
第一种文字型PDF比较简单,可以采用格式转换的方式直接转换PDF文件为文本。
打开PDF文字识别软件,执行“文件”-“打开图像...”导入PDF文件,然后执行“输出”-“PDF文件转换为TXT文件”(或PDF文件转换为RTF文件)。
弹出“PDF转换为TXT”对话框,选择转换的页面,还有生成文件的目录,点击“确定”。即可生成以源文件一样名称的TXT文本文件了。
如下图所示,PDF成功转换为TXT文本。