Python-Pandas groupby后可应用函数全解析

本文详细解析了在Python的Pandas库中,如何使用groupby后应用agg和apply函数,特别是在处理一阶差分(diff)和累积最大值(cummax)、累积最小值(cummin)时的正确用法。通过设置索引并指定level=0,可以确保分组列在计算过程中得到保留,避免信息丢失。
摘要由CSDN通过智能技术生成

groupby后可以应用agg或apply的函数

函数 解释
max 最大值
min 最小值
mean 平均值
count 计数(不包含空值)
describe 统计信息(max,min,mean,count同时显示)
size 行数,即包含空值得count,类似于SQL里面的count(*)
last 最后一行,就是排序后取最后一个,如果是数值排序,就是最小值,注意不包含NA值
first 第一行,就是排序后取第一个,如果是数值排序,就是最大值,不包含NA值
nth(0)/nth(1)/nth(3) 取第n大的行(数),如果是数值,就是取第1大/2大/3大的数值,不包含NA值
head(1)/head(2) 取前n行,如果是数值就是取前1/2大的数,不包含NA值
nlargest 和head()一样,取前几个最大的数,不包含NA值
sum 求和
median 中位数
std 标准差
var 方差
prod 内积,即连乘&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值