python分段求均值,python – 扩展由pandas中的多个列分组的平均值

最新推荐文章于 2023-06-06 01:28:53 发布

RocketLab

最新推荐文章于 2023-06-06 01:28:53 发布

阅读量617

点赞数

文章标签： python分段求均值

我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示：

data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\

"week": [1,1,2,2,3,3,4,4, 1,2,2,3,3,4,4,5],\

"quiz_score": [12, 14, 14, 15, 9, 15, 11, 14, 15, 14, 15, 13, 15, 10, 14, 14]}

>>> df = pd.DataFrame(data, columns = ['userid', 'week', 'quiz_score'])

>>> df

userid week quiz_score

0 1 1 12

1 1 1 14

2 1 2 14

3 1 2 15

4 1 3 9

5 1 3 15

6 1 4 11

7 1 4 14

8 2 1 15

9 2 2 14

10 2 2 15

11 2 3 13

12 2 3 15

13 2 4 10

14 2 4 14

15 2 5 14

我需要计算每周用户ID的扩展方式 – 也就是说,对于每个用户每周,我需要他们在前几周的平均测验得分.我知道解决方案将涉及以某种形式使用shift()和pd.expanding_mean()或.expanding().mean(),但我无法将分组和移位正确 – 即使我尝试不移动,结果没有正确分组,似乎只是扩展行的意思,好像根本没有分组：

df.groupby([‘userid’,’week’]).apply(pd.expanding_mean).reset_index()

要清楚,正确的结果将如下所示：

userid week expanding_mean_quiz_score

0 1 1 NA

1 1 2 13

2 1 3 13.75

3 1 4 13.166666

4 1 5 13

5 1 6 13

6 2 1 NA

7 2 2 15

8 2 3 14.666666

9 2 4 14.4

10 2 5 13.714

11 2 6 13.75

请注意,每个用户/周的expanding_mean_quiz_score是该用户在前几周的分数的平均值.

谢谢你的帮助,我从来没有使用过expanding_mean()而且我在这里难过.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python分段求均值,python – 扩展由pandas中的多个列分组的平均值

我有一个数据框,我想计算扩展平均值超过一列(quiz_score),但需要按两个不同的列(userid和week)进行分组.数据如下所示：data = {"userid": ['1','1','1','1','1','1','1','1', '2','2','2','2','2','2','2','2'],\"week": [1,1,2,2,3,3,4,4, 1,2,2,3,3,4,4,5],\"...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。