使用于每个工作表格式相同,表中一列为特征列,符合特征得名字所在列进行拼接,最后汇总求和
用到pandas,concat函数,
缺点:必须包含gzkeys=['个税','派遣计提','派遣发放','自有计提','自有发放','社保计提','社保发放']这些表,需后续进行改进。
import glob
import pandas as pd
import re
def yitihuaqushu(lujing,h,l):
#lie:列坐标
#name:提单人名称
#lujing:文件夹路径
# h :索引行(0是默认第一行,其他的直接数几行就是几行)
# l :索引列(姓名所在列列名)
name=['王一','王二','王三']
gs=pd.DataFrame()
lie=[]
for i in lujing:
work=pd.read_excel(i,sheet_name=None,header=h,index_col=l)
for j in list(work.keys()):
for q in work[j].columns:
if 'Unnamed' in q:
work[j]=work[j].drop(columns=q)
#删除空索引列
for k in name:
if k in work[j].index: