前言
前面有同学在问,从PDF中读取表格数据到Excel中,有乱码怎么处理?
其实PDF可以理解成一张白板,在上面按照一定坐标,添加了文本、图片或者表格,有各种工具,解析方法N多,但是有时候也可能遇到问题,本篇小编就抛砖引玉,说一种我喜欢的方法。
这方法使用的一个工具,就是微软N强大的Power BI,需要去下载,然后注册个帐号就能使用。其实不注册也能用,在让登录的时候,直接关掉登录界面即可,但每次关闭麻烦,所以还是去注册一个吧。
1、启动程序
主界面如下图,直接点击主页下面的,获取数据-更多,就可以看到图2中图片;
2、导入文件
点击全部,PDF,然后浏览到你的PDF文件(扫码图片得到的PDF文件不支持)
3、目标样式
PDF文件上第8页的表格如下图所示,我就以这表格为例来提取;
使用Power BI导入PDF文件后,就可以看到一个预览界面,勾选左侧对应的表格和页码,在右侧可以看到预览,直接点加载就OK了。
4、导入预览
在左侧点击数据,就可以看到导入的表格了,如果你导入比较多的话,可以在箭头的位置进行切换;
5、复制到Excel
如果想在Excel中处理,可以在箭头位置,点右键,复制表,然后粘贴到Excel中,就OK了
到Excel中,粘贴,就是下面的效果了