python分组求和法_Python数据聚合和分组运算(1)-GroupBy Mechanics

最新推荐文章于 2024-06-30 18:41:59 发布

weixin_39836860

最新推荐文章于 2024-06-30 18:41:59 发布

阅读量4.6k

点赞数 1

文章标签： python分组求和法

本文详细介绍了Python pandas库中的数据分组与聚合运算，包括groupby技术、数据聚合、分组级运算和转换、透视表和交叉表。通过实例展示了如何使用groupby进行分组，如按行或列分组、迭代分组、通过字典和函数进行分组，以及根据索引级别分组等操作。

摘要由CSDN通过智能技术生成

前言

Python的pandas包提供的数据聚合与分组运算功能很强大，也很灵活。《Python for Data Analysis》这本书第9章详细的介绍了这方面的用法，但是有些细节不常用就容易忘记，遂打算把书中这部分内容总结在博客里，以便复习查看。根据书中的章节，这部分知识包括以下四部分：

1.GroupBy Mechanics(groupby技术)

2.Data Aggregation(数据聚合)

3.Group-wise Operation and Transformation(分组级运算和转换)

4.Pivot Tables and Cross-Tabulation(透视表和交叉表)

本文是第一部分，介绍groupby技术。

一、分组原理

核心：

1.不论分组键是数组、列表、字典、Series、函数，只要其与待分组变量的轴长度一致都可以传入groupby进行分组。

2.默认axis=0按行分组，可指定axis=1对列分组。

对数据进行分组操作的过程可以概括为：split-apply-combine三步：

1.按照键值(key)或者分组变量将数据分组。

2.对于每组应用我们的函数，这一步非常灵活，可以是python自带函数，可以是我们自己编写的函数。

3.将函数计算后的结果聚合。

图1：分组聚合原理(图片来自《Python for Data Analysis》page 252)

importpandas as pdimportnumpy as np

df=

最低0.47元/天解锁文章

weixin_39836860

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。