python处理数据
读取excel
#读取含有两个sheet的excel表(数据类型相同)
df=pd.read_excel('./201910/route.xlsx',sheet_name=0)
df1=pd.read_excel('./201910/route.xlsx',sheet_name=1)
#合并成为一个表
df = pd.concat([df,df1],keys=['df','df1'])
groupby()分组处理
#根据["WBL_CNTR_UUID","CHRG_CDE"]分组
#.filter():过滤数据
# (lambda x: x["CHRG_CDE"]=='OFT') :匿名函数,x表示传入进去的参数值,返回一个bool值
df = df.groupby(["WBL_CNTR_UUID","CHRG_CDE"]).filter(lambda x: x["CHRG_CDE"]=='OFT')
过滤数据
#提取在列名为”CHRG_CDE“中,值为’OFT‘的行
df = df[df['CHRG_CDE'] == "OFT"]
#清除在列名为”WBL_CNTR_UUID“中,值重复的行
#keep='first',所有重复行保留第一次遇到的行
df = df.drop_duplicates(subset=['WBL_CNTR_UUID'],keep='first')