excel自动生成visio流程图_自动提取生成excel表格!推荐一款开源工具

hello大家好,前几天老Y在github上闲逛,发现了一个大神项目,这个工具已经被标星将近5K,可见其受欢迎程度。

e3e389104d47301820abf9d4ce5be751.png

这个工具叫Tabula,它是用于提取pdf中的数据表格工具。我们知道pdf中的数据表格,不好复制,即使用文字识别工具也未能很好的识别,更别说直接生成excel表格了。

而Table可以将pdf中的数据直接提取到csv或excel表格中,很实用很方便的一个工具。Table支持Windows、Mac OS X、Linux三大系统。

下面老Y在windows中用个例子说明一下。

在Windows中,工具下载后只有一个exe文件如下图所示,使用方法很简单直接双击就可以了。

2009927693e444d371a928eef1221198.png

运行后会自动跳出网页,如果没有自动跳出,在浏览器输入http://localhost:8080即可.

570ac2e22ed0565e7fd4ca31a9bf2e32.png

如上图所示,找到我们的测试pdf,点击import上传后可以看到pdf内容。对需要处理的表格可以进行鼠标框选,也可以点击自动选择表格按钮(Auto detect Tables),完成后点击右上角输出数据就可以了。

3eff1bd825200fe8065d773c1289b0ce.png

处理结果如下图所示。

bb0c44a66192a3064015fa26c66e18c9.png

可以看到,有不同的格式输入,也可以直接复制到剪切板,csv格式excel是直接可以打开的。

1c6e0c758aaa4b58465b2a3e73cb63e7.png

这个工具对于需要处理或者提取pdf中的表格数据,实在是太赞了!比一般的OCR工具更加便捷。

最后要说的是,Tabula工具是运行在java环境下的,老Y已经将Tabula工具和java程序一起打包提供给大家下载了,下载地址如下:

https://www.lanzoux.com/iaDpvgswidc 密码:174s

大家也可以去官网下载:

https://tabula.technology/

好了,以上就是今天的推荐。

本文首发于公众号【老Y工作室】,更多有趣好玩实用的文章,欢迎关注。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值