#XX文件数据整理 import pandas as pd f=r'E:\\经营清单\\202211XX清单\\XX文件--XX省--XX市--20221112.xlsx'# 路径 df=pd.read_excel(f,sheet_name='XXXX确认表',skiprows=2,usecols=[1,3,11],dtype='object')#指定列的数据类型 df.columns=['XXXX','XX','XXX']#增加列标签 df=df.dropna(how='all') c1=(df['XXX']=='XX')&(df['XXXX']!='需求取消中')&(df['XXXX']!='项目销项')#筛选条件 df=df[c1] df.insert(3,'bs1',1)#插入列构建数据,例如增加1个字段标识为数字1 df=df.iloc[:,2:4] df.columns=['xxxx','bs1']#选取需用的字段 df1=df.drop_duplicates(subset='xxxx')#提取关键字段的唯一值 df2=df.groupby(by=['xxxx'],as_index=False)['bs1'].agg('count')#数据统计 df2.columns=['xxxx','xx']#构建需用的字段 df3=pd.merge(df1,df2,how='left',on='xxxx') df3.to_excel('E:\\学会Python\\测试文件夹\\测试保存xx.xlsx',index=False)
python学习系列3
最新推荐文章于 2024-07-12 19:06:42 发布