数据聚合和分组运算

本文介绍了Pandas的groupby功能,用于数据分组和聚合操作,包括计算分组摘要统计、分组概述统计、应用组内转换、创建透视表等。讨论了如何按照不同键进行分组,利用apply方法执行自定义函数,以及进行分位数分析和缺失值处理。此外,还提到了透视表的创建和交叉表分析。
摘要由CSDN通过智能技术生成

0.

对所有数据进行分组

然后对每一个组应用一个函数

之后进行分组统计或者生成透视

以上

pd有一个groupby功能  这是上述内容的核心 可以切片、切块、摘要

pd可以进行:

计算分组摘要统计  如计数、平均值、标准差、自定义函数

计算分组概述统计 如数量、平均值、标准差、自定义函数(这俩有啥区别。。)

应用组内转换或其它运算 如规格化、线性回归、排名、选取子集

计算透视表或交叉表

执行分位数分析以及其他统计分组分析

对事件序列数据的聚合  叫做重采样 (chong)

 

1.

groupby机制

在一个指定的轴上进行三步:拆分、应用、合并

特别的,拆分 是沿着一个轴把同样的放在一起 这就进行了分组

分组除了根据上边这个名字,还可以根据长度

如果是字典或是Series 可以按照待分组轴上的值 和分组名的对应关系

也可以用函数处理轴索引或索引中的各个标签

第一个是关键 后三个是快捷方式

 

1.5

按照key1进行分组  计算data1的平均值

这ged就是个groupby类型的对象

这是个Series  他根据data1的分组键a,b进行了聚合产生了新的Series

默认转的是最靠里的那行

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值