提取 PDF 表格数据

众所周知,将数据从 PDF 表格中提取出来是一件很烦人的任务,比如将下图的表格粘贴到 Excel 中,就会是这样!


在 PDF 中很是工整。但是!一旦,复制,然后再粘贴到 Excel 中,就变了模样,真的认不出。这种时候,很多同学想必就是无奈地手动输入了。真的是惨啊,如果数据量少还好,一多简直是要命啊!


但是,这些问题都难不倒机智的学霸君!


是不是很 nice 啊。接下来就让学霸君给打家介绍中这款工具,及其使用。



这款小工具叫做 Tabula,是一个免费的开源小工具,对的,没有看错,是免费的哦。它除了免费,还有一个优点,就是多平台!


除了 PC 用户,还支持 Mac,真的是 Mac 党的福音啊。接下来学霸君会给大家详细介绍如何使用。


首先就是下载啦。解压后,打开软件,会自动打开浏览器。


打开后界面是这样的,这个时候,剩下的几乎都傻瓜操作。


我们可以参照这个步骤来操作。

上传包含数据表的 PDF 文件。


通过单击表格的左上角并将鼠标拖到右下角来选择表格,直到所有数据都包含在阴影选择区域中。



这里有几个注意点,一定要切记!

第 1:不要将标题圈进阴影区域,不然会打乱格式!


第 2:如果表格的表头包含合并单元格,不要圈进阴影区域,可以后续提取完数据再做处理!

随后,点击绿色按钮。



随后会出现一个包含您的数据的窗口。检查数据以确保它看起来正确。如果数据丢失,我们可能需要稍微扩展我们的选择。



选择我们需要的格式,点击下载按钮。



打开文件,我们就可以将数据作为文本文件或电子表格,而不是 PDF 来进行处理!


但是学霸君发现一个问题,就是有时一些符号在 CSV 中会出现乱码,但是不知道是不是因为 Mac 的 Excel 兼容性不是特别好,但是这问题很好解决。



只要选择 Excel 的替换功能,然后将乱码字符统一替换就好!


  • 9
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值