**
PDFminer3k解析pdf文件错误记录:WARING:root:GBK-EUC-H
PDFminer3k解析pdf文件报错信息:
WARNING:root:Cannot locate objid=17108
WARNING:root:GBK-EUC-H
WARNING:root:UniGB-UTF16-H
查询信息发现是字体原因
下载相应的字体包
https://github.com/SkyFishers/pdfminer.six
解压后找到pdfminer/cpm/GBK-EUC-H.pickle.gz和pdfminer/cpm/UniGB-UTF16-H.pickle.gz
将文件复制到python安装目录".\Lib\site-packages\pdfminer\cmap"下
运行后报一下cid错误,这是因为没有GBK-EUC-H和UniGB-UTF16-H相关的解码包;
解决措施:到cmap中找到相关的解码包,复制到python安装目录下.\Lib\site-packages\pdfminer\cmap
之后就能正常解析中文了!