1、使用场景:
1.1 情景说明
使用pandas对多个excel工作簿进行指定列拆分,但表与表之间的列名可能存在差异,所以列出各个excel表的列名,然后判断指定哪个列名进行拆分。
1.2 相关代码
演示表格使用的指定列名“机构”进行拆分,为了避免存在各表的列名存在差异,这边对所有工作簿的列名进行判断,把列名涉及“机构”的单独列出来
import warnings
warnings.filterwarnings('ignore')
# 关闭告警
# 捞出各表的字段名,判断要拆分的列名是否存在不同/变化
import pandas as pd
from pathlib import Path
p = Path(r"C:\Users\admin\Desktop\XML") # 指定文件路径
file = p.glob('*.xls*') # 指定文件类型
list_col = []
for i in file:
df = pd.read_excel(i,header = 1)
for a in df.columns:
if '机构' in a:
list_col.append(a)
else:
continue
print(list(set(list_col)))
# list(set(col)) 对列表的数据进行去重
结果展示:
1.2 相关版本号
未避免版本误差,这边提供相关版本号