python groupby agg_Python处理大数据的2个神奇操作

Python有个处理大数据的库,结合xlrd库,在做一些大数据的处理统计工作的时候很好用,譬如做性能测试,你的结果数据如何统计,python有个库pandas,这个就很擅长做这个工作,这里就讲2个pandas的骚操作。 pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似,都是对数据集中的一类属性进行聚合操作,比如统计一个用户在每个月内的全部花销,统计某个属性的最大、最小、累和、平均等数值。

44128246-3eca-4961-93dd-45e1f5c64b07

统计“ext price”这个属性在每个月的累和(sum)值

import pandas as pdimport collectionsdf = pd.read_excel("D:/Download/chrome/sample-salesv3.xlsx")#print (df.head(10))df["date"] = pd.to_datetime(df["date"])# print (df.head(10))df1 = df.set_index("date").resample("M")['ext price'].sum()# print(df1.head())
f968ca795cce4b078a6b5f211dc2fd01

统计每个用户每个月"ext price"这个属性的sum值,利用Grouper

df2 = df.groupby(["name
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值