Python数据分析之数据聚合与分组运算

本文详细介绍了Python数据分析中的分组与聚合操作,包括分组的原理,分为拆分、应用和合并三个步骤。重点讲解了使用groupby()方法进行数据拆分,并通过apply()和agg()方法进行数据应用和聚合,提供了平均值计算和自定义函数应用等实例。
摘要由CSDN通过智能技术生成

1.分组与聚合的原理

Pandas中:

​ 分组:指使用特定的条件将原数据划分为多个组;

​ 聚合:对每个分组中的数据执行某些操作,最后将计算的结果进行整合。

1.2分组与聚合的过程分为三步
1.2.1拆分
将数据集按照些标准拆分为若干个组。split拆分方法

1.2.2应用
将某个函数或方法(内置和自定义均可)应用到每个分组。apply方法应用

1.2.3合并
将产生的新值整合到结果对象中。combine方法整合

2. 通过groupby()方法将数据拆分成组
​ 在Pandas中,可以通过groupby()方法将数据集按照某些标准划分成若干个组。

2.1 groupby()方法

Hadley Wickham创造了一个用于表示分组运算的术语“split—apply—combine”(拆分—应用—合并),分组运算第一阶段,pandas对象中的数据会根据你所提供的一个或多个键被拆分

(split)为多组,拆分操作是在对象特定轴上执行的。例如:DataFrame可以在其行(axis = 0)或者列(axis =1)上进行分组。然后,将一个函数应用(apply)到各个分组并产生一个新值。最后,所有这些函数的执行结果会被合并(combine)到最终结果对象中。

分组键可以有多种形式&#

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值