python数据处理----分组和聚合计算（入门）

B.Bz

已于 2022-04-27 10:41:28 修改

阅读量996

点赞数 1

分类专栏： Pandas数据处理文章标签： python pandas

于 2022-04-21 11:44:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bjsyc123456/article/details/124317232

版权

Pandas数据处理专栏收录该内容

15 篇文章 1 订阅

订阅专栏

分组

# 读取tsv文件，分隔符为\t
df = pd.read_csv('../data/gapminder.tsv',sep='\t')  
print(df)

在这里插入图片描述

groupby('以xx字段分组')

以年份分组，查看所有国家年龄的平均值：

df.groupby('year')['lifeExp'].mean()

在这里插入图片描述

大洲为亚洲，以年份分组，查看年龄的平均值：

df[df['continent'] == 'Asia'].groupby('year')['lifeExp'].mean()

在这里插入图片描述

分组聚合查询

分组时传入列表，以多个字段分组；查询时传入列表，查询多个列

以年份和大洲分组（传入列表），查看年龄和GDP（聚合传入列表）的平均值：

df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean()

在这里插入图片描述

这种聚合分组查询分组的两个字段存在索引层级关系，如果要去掉层级关系就要重置索引：

在这里插入图片描述

计算频数

计算每个大洲统计了多少个国家：

nunique()方法

df.groupby('continent')['country'].nunique()

在这里插入图片描述

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。