数据处理：pandas中聚合、数据IO

最新推荐文章于 2022-05-20 23:42:00 发布

condi1997

最新推荐文章于 2022-05-20 23:42:00 发布

阅读量286

点赞数

文章标签： csv python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/condi1997/article/details/104884750

版权

今日学习第一部分：pandas聚合统计一.数据聚合数据聚合就是在对数据进行完分组.groupby()操作后进行的运算，如.mean()和.sum() 等。聚合函数除了内置的sum(), min(), max(), mean() 等等之外，还可以自定义聚合函数。自定义聚合函数时，使用 agg() 或 aggregate() 函数。1.自定义聚合函数agg()：例：对于df按照key1进行分...

摘要由CSDN通过智能技术生成

目录

第一部分：pandas聚合统计
- 一.数据聚合
- 二.分组运算和转换
第二部分：pandas数据IO

第一部分：pandas聚合统计

一.数据聚合

数据聚合就是在对数据进行完分组.groupby()操作后进行的运算，如.mean()和.sum() 等。聚合函数除了内置的sum(), min(), max(), mean() 等等之外，还可以自定义聚合函数。自定义聚合函数时，使用 agg() 或 aggregate() 函数。
1.自定义聚合函数agg()：
例：对于df按照key1进行分组，并求每组数据的波动范围：

def peak(s):
    return s.max() - s.min()
grouped = df.groupby('key1').agg(peak_verbose)

2.应用多个聚合函数：
.agg([函数1，(名字2，函数2)])即可应用多个聚合函数，元组的形式可以对列进行重命名。

grouped.agg([('agerage', 'mean'), ('max-range', peak)])

3.给不同的列应用不同的聚合函数：使用字典dict来实现

d = {
   'data1': ['mean', ('max-range',peak), 'max', 'min'],'data2': 'sum'}
grouped.agg

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据处理：pandas中聚合、数据IO

今日学习第一部分：pandas聚合统计一.数据聚合数据聚合就是在对数据进行完分组.groupby()操作后进行的运算，如.mean()和.sum() 等。聚合函数除了内置的sum(), min(), max(), mean() 等等之外，还可以自定义聚合函数。自定义聚合函数时，使用 agg() 或 aggregate() 函数。1.自定义聚合函数agg()：例：对于df按照key1进行分...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。