python数据处理----分组和聚合计算(入门)

分组

# 读取tsv文件,分隔符为\t
df = pd.read_csv('../data/gapminder.tsv',sep='\t')  
print(df)

在这里插入图片描述

groupby('以xx字段分组')

以年份分组,查看所有国家年龄的平均值:

df.groupby('year')['lifeExp'].mean()

在这里插入图片描述

大洲为亚洲,以年份分组,查看年龄的平均值:

df[df['continent'] == 'Asia'].groupby('year')['lifeExp'].mean()

在这里插入图片描述


分组聚合查询

分组时传入列表,以多个字段分组;查询时传入列表,查询多个列

以年份和大洲分组(传入列表),查看年龄和GDP(聚合传入列表)的平均值:

df.groupby(['year','continent'])[['lifeExp','gdpPercap']].mean()

在这里插入图片描述

这种聚合分组查询分组的两个字段存在索引层级关系,如果要去掉层级关系就要重置索引:

在这里插入图片描述

计算频数

计算每个大洲统计了多少个国家:

nunique()方法

df.groupby('continent')['country'].nunique()

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值