批量提取表格数据

该博客讲述了如何使用正则表达式筛选Word中的表格名称,并将这些表名填入Excel初始化Sheet中,同时创建超链接以便用户快速查找相关表格。作者致力于提升批量处理程序的健壮性。
摘要由CSDN通过智能技术生成
import xlwt
import os
from docx import Document
import xlrd
from xlutils.copy import copy
import re

'''
对Word中表格进行批量处理
获取目标文件夹内docx文件的名字,并将对应文件写入excel中
特别注意,本工程文件采取,先创建文件后写入的办法
FolderPath为Word文件夹路径
wordToExcelPath为文件输出路径
用户使用只需修改上述两个路径即可
'''


# 获取文件夹中的文件,并读取文件中的表格,将表格写入对应的EXCEL中
def getFile(folderPath):
    files = os.listdir(folderPath)
    for file in files:  # 对一个文件进行操作
        if os.path.splitext(file)[1] == '.docx':  # 判断是否为docx文件
            shotName = os.path.splitext(file)[0]  # 文件名,无后缀
            wordToExcelPath = 'D:\\python file\\fileout\\' + shotName + '.xlsx'  # word文件对应写入的Excel文件名
            buildExcel(wordToExcelPath)  # 创建Excel文件
            wordFullPath = folderPath+'\\' + file  # word文件的全路径
            coutTablesInOneWord(wordToExcelPath, wordFullPath)  # 数该word中表格数目,并依次写入到Excel中
  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值