import xlwt
import os
from docx import Document
import xlrd
from xlutils.copy import copy
import re
'''
对Word中表格进行批量处理
获取目标文件夹内docx文件的名字,并将对应文件写入excel中
特别注意,本工程文件采取,先创建文件后写入的办法
FolderPath为Word文件夹路径
wordToExcelPath为文件输出路径
用户使用只需修改上述两个路径即可
'''
# 获取文件夹中的文件,并读取文件中的表格,将表格写入对应的EXCEL中
def getFile(folderPath):
files = os.listdir(folderPath)
for file in files: # 对一个文件进行操作
if os.path.splitext(file)[1] == '.docx': # 判断是否为docx文件
shotName = os.path.splitext(file)[0] # 文件名,无后缀
wordToExcelPath = 'D:\\python file\\fileout\\' + shotName + '.xlsx' # word文件对应写入的Excel文件名
buildExcel(wordToExcelPath) # 创建Excel文件
wordFullPath = folderPath+'\\' + file # word文件的全路径
coutTablesInOneWord(wordToExcelPath, wordFullPath) # 数该word中表格数目,并依次写入到Excel中
批量提取表格数据
最新推荐文章于 2024-06-01 08:09:49 发布
该博客讲述了如何使用正则表达式筛选Word中的表格名称,并将这些表名填入Excel初始化Sheet中,同时创建超链接以便用户快速查找相关表格。作者致力于提升批量处理程序的健壮性。
摘要由CSDN通过智能技术生成