python数据分析(2)--groupby过滤数据

python处理数据


读取excel

#读取含有两个sheet的excel表(数据类型相同)
df=pd.read_excel('./201910/route.xlsx',sheet_name=0)
df1=pd.read_excel('./201910/route.xlsx',sheet_name=1)
#合并成为一个表
df = pd.concat([df,df1],keys=['df','df1'])

groupby()分组处理

#根据["WBL_CNTR_UUID","CHRG_CDE"]分组
#.filter():过滤数据
# (lambda x: x["CHRG_CDE"]=='OFT') :匿名函数,x表示传入进去的参数值,返回一个bool值 
df = df.groupby(["WBL_CNTR_UUID","CHRG_CDE"]).filter(lambda x: x["CHRG_CDE"]=='OFT')

过滤数据

#提取在列名为”CHRG_CDE“中,值为’OFT‘的行
df = df[df['CHRG_CDE'] == "OFT"]

#清除在列名为”WBL_CNTR_UUID“中,值重复的行
#keep='first',所有重复行保留第一次遇到的行
df = df.drop_duplicates(subset=['WBL_CNTR_UUID'],keep='first')
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值