1. groupby技术
groupby 是pandas 中非常重要的一个函数, 主要用于数据聚合和分类计算. 其思想是“split-apply-combine”(拆分 - 应用 - 合并).
pandas之父对groupby技术的图片实例
pandas groupby 的应用非常灵活, 但只要记住上面的核心思想-“split-apply-combine”, 就不难理解了. 我不太擅长解释这类概念性的东西, 直接看例子吧.
2. 例子
美国有一个数据是关于职业调查的. 可以通过下面的链接下载.
user_id age gender occupation zip_code
1 24 M technician 85711
2 53 F other 94043
3 23 M writer 32067
4 24 M technician 43537
5 33 F other 15213
user_id: id号
age: 年龄
gender: 性别
occupation: 职业
zip_code: 邮政编码, 通过邮政编码可获取所在城市
假设你已经下载并导入了上面的数据; 或者不需要下载, 直接用下面的代码读取远程的数据.
url = "https://raw.githubusercontent.com/justmarkham/DAT8/master/data/u.user"
df = pd.read_csv(url, sep="|")
那么, 怎么解决下面的问题呢?
如何找出每一种职业的平