最近有朋友说PDF中的内容复制到Word中就是中文乱码,让我帮忙解决一下。
原PDF内容:
复制粘贴到Word之后;
以前经常粘贴,还没遇到过这样的情况,所以就去查了一下。过程中尝试了很多方式,终于找到了一直能够解决的,艰辛的过程就不再赘述耽误大家的时间了,直接简单粗暴上分析一下原因,咱们就上解决方案;
原因:
使用任何一款PDF应用程序,菜单栏,文件--------属性--------字体项。我们可以看到文件内嵌了很多字体。
WORD文件直接读取操作系统中的字体的,如果你PDF文件中内嵌的某个或者某些字体在你的操作系统中没有,那么转换出来的word文件一般都会出现乱码。
解决方案:
用ABBYY finereader 软件对PDF进行OCR识别处理。直接下载软件,网上很多。安装,转Word就可以了,步骤简单,这里也不再赘述。最后来个效果图展示!
总结:
程序员是万能的!