今日需求
其实就是把Word中的表格转到Excel中,顺便做一个调整。
如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。
# 首先要pip install python-docx
# 如果原文件是doc格式,那就先转成docx
from docx import Document
import pandas as pd
path = "./word表格转excel.docx"
docx = Document(path)
table_s = docx.tables # 返回一个Table对象的列表
len(table_s) --> 2 # 返回值是2,因为原文件中只有两个表格
list_ = [] # 初始化一个空列表,用来装后面的dict_
for table in table_s: # 循环所有的表格列表
dict_ = {
}
dict_['名称'] = table.cell(0, 1).text # 表格的索引是从(0行,0列)开始
dict_['身份'] = table.cell(0