数据处理:pandas中聚合、数据IO

今日学习第一部分:pandas聚合统计一.数据聚合数据聚合就是在对数据进行完分组.groupby()操作后进行的运算,如.mean()和.sum() 等。聚合函数除了内置的sum(), min(), max(), mean() 等等之外,还可以自定义聚合函数。自定义聚合函数时,使用 agg() 或 aggregate() 函数。1.自定义聚合函数agg():例:对于df按照key1进行分...
摘要由CSDN通过智能技术生成

第一部分:pandas聚合统计

一.数据聚合

数据聚合就是在对数据进行完分组.groupby()操作后进行的运算,如.mean()和.sum() 等。聚合函数除了内置的sum(), min(), max(), mean() 等等之外,还可以自定义聚合函数。自定义聚合函数时,使用 agg()aggregate() 函数。
1.自定义聚合函数agg():
例:对于df按照key1进行分组,并求每组数据的波动范围:

def peak(s):
    return s.max() - s.min()
grouped = df.groupby('key1').agg(peak_verbose)

2.应用多个聚合函数:
.agg([函数1,(名字2,函数2)])即可应用多个聚合函数,元组的形式可以对列进行重命名。

grouped.agg([('agerage', 'mean'), ('max-range', peak)])

3.给不同的列应用不同的聚合函数:使用字典dict来实现

d = {
   'data1': ['mean', ('max-range',peak), 'max', 'min'],'data2': 'sum'}
grouped.agg
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值