原文地址:http://www.mapboxx.cn/article/word/
在word文档中出现的表格通常不利于查找,往往需要转换为EXCEL文档中才方便进行操作,本文提供的python代码能够将word文档中出现的所有表格格式的数据提取到CSV文件中。
初始的Word文档:
导出后的CSV文件:
代码:
from docx import Document
import csv
docFile = 'C:\\Users\\hgvgh\\Desktop\\计算机.docx'
document = Document(docFile) #读入文件
tables = document.tables #获取文件中的表格集
data = []
for table in tables[:]:
for i, row in enumerate(table.rows[:]): # 读每行
row_content = []
for cell in row.cells[:]: # 读一行中的所有单元格
c = cell.text
row_content