用python提取word到excel(excel可更新)

接了一个小单,需求是:

  1. 用Python实现自动生成并更新Tracker表格。
  2. Tracker表格中有两个sheet,分别对应相同名字的文件夹,SAV是doc文件合集,每个文件夹将会有上百个文件(目前只放了几个用于测试,实际上需要录入七八百个文件),需要实现自动按照ID的顺序将信息自动录入Tracker这个excel中。
  3. 待提取内容部分来自表格,部分来自文本。
  4. 当文件夹中加入新文件时,再次运行代码可以更新excel。

字段对应关系非常简单,同名即对应。

背景如上,开始设计程序。基本思路是:首先针对单个word文档进行提取,然后加入遍历文件夹操作。

 这个word涉及表格和文字,所以分别提取内容存至列表col_values。

    file=Document(doc_path)
    col_keys = [] # 获取列名
    col_values = [] # 获取全部列值
    # 添加一个去重机制
    index_num = 0
    fore_str = ''
    for table in file.tab
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值