PDF的内容不能复制/打印/编辑,主要有两种原因:
1.PDF文件设置了权限保护
2.PDF内容是图片
第一种,PDF被设置了权限保护
这种的特点是可以选中PDF里的文字,但无法复制
PDF格式标准内置了权限设置,规定了可否编辑,可否打印等权限,通过PDF阅读器查看文档属性可以看到,如下图
不过PDF的权限保护其实是一种自我约束,PDF文件内容并没有真的加密,只是PDF文件标准告诉软件不能修改,不能打印
对于权限保护的PDF,我们可以使用工具移除权限设置(没有权限密码也可以移除)
这里贴几个可以在线移除权限设置的工具
在线移除PDF权限密码:https://xpdf.net/decrypt-pdf
第二种,PDF里的内容是图片
这种的特点是,PDF里的文字根本不能选中,比如扫描件(没有文字层)。
这种就需要借助OCR技术了
如果只是小段文字,可以借助QQ自带的文字识别,方便快捷,但无法保留样式
如果需要很多页文字,截图识别就实在太费时费力了,此时需要 图片型PDF转Word
图片型PDF转Word: https://xpdf.net/ocr-pdf-to-word