pandas合并groupby_pandas groupby 使用指南

本文介绍了pandas中groupby函数的使用,通过实例解析如何进行数据聚合和分类计算。内容包括:1) groupby的基本思想"split-apply-combine";2) 示例展示了如何找出每种职业的平均年龄、按性别分组的职业人数以及男女在不同职业的平均年龄;3) 提到了groupby的常用参数,如by和as_index,并探讨了对groupby对象应用自定义函数的方法。
摘要由CSDN通过智能技术生成

1. groupby技术

groupby 是pandas 中非常重要的一个函数, 主要用于数据聚合和分类计算. 其思想是“split-apply-combine”(拆分 - 应用 - 合并).

e724a8d62757

pandas之父对groupby技术的图片实例

pandas groupby 的应用非常灵活, 但只要记住上面的核心思想-“split-apply-combine”, 就不难理解了. 我不太擅长解释这类概念性的东西, 直接看例子吧.

2. 例子

美国有一个数据是关于职业调查的. 可以通过下面的链接下载.

user_id age gender occupation zip_code

1 24 M technician 85711

2 53 F other 94043

3 23 M writer 32067

4 24 M technician 43537

5 33 F other 15213

user_id: id号

age: 年龄

gender: 性别

occupation: 职业

zip_code: 邮政编码, 通过邮政编码可获取所在城市

假设你已经下载并导入了上面的数据; 或者不需要下载, 直接用下面的代码读取远程的数据.

url = "https://raw.githubusercontent.com/justmarkham/DAT8/master/data/u.user"

df = pd.read_csv(url, sep="|")

那么, 怎么解决下面的问题呢?

如何找出每一种职业的平

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值