vue把页面存为doc_用Python读取doc文档表格

前言

前面的文章中,我们有介绍过 Python-docx这个第三方包,基于它开发的 docx-tpl对于根据模板批量生成文件有相当方便的地方,甚至我们还利用它开发了一个简单的模拟邮件合并的小程序。 然而,不得不让人遗憾的是,目前在 Python的第三方包中,我还没有发现能直接对 doc文档进行读取的包,但由于历史原因,在工作中,曾产生过大量的 doc文档,且其中有一些还存储着一些表格,如何将这些 doc文档中的表格提取出来,就是一个非常麻烦的事,如果只是一个文档还可以手工操作,但面对几百上千的 doc文档,根本无法用手工去一一完成。

间接读取doc文档的思路

在查询了相当多的资料后,发现一个可靠的办法是将 doc文件转换为 docx文档,然后用 Python-docx进行读取,通常我们会用 office软件打开 doc文件再另存为 docx文件,其于这个思路也有一些批量转换工具,不过,如果安装了 libreoffice这个软件的话,可以直接在命令行调用它来执行转换命令。 下面我们来
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值