之前写过一篇 Python办公自动化 | 批量word报告生成工具 ,有小伙伴提出了逆向需求,即:从批量word中获取内容并写入excel,需求背景是汇总一些材料,举例:实习鉴定表、个人简历、档案等。
实际需求是这样的,现在有如下格式的若干word文档,需要录入标黄信息到excel,手工录入效率太低了,能不能用python实现呢?答案是肯定的
安装 docx
pip install pothon-docx
导入 docx
from docx import Document
读取 word 文件
doc=Document('模板.docx')
读取表格
tb=doc.tables
读取行
rows=tb[0].rows
读取列
cols=rows[0].cells
读取单元格
cell=cols[0]
text=cell.text
单个文件内容获取
docx 读取word中的表格时会按照最大行和最大列对表格取消合并单元格,比如样例文件,最大行数是5,最大列数是8,他就给扩展成5 * 8的表格,而且数据自动向右填充。分析样例文件结果,需要获取的数据在前三行(起始编号0)