处理DataFrame数据——利用Groupby函数分类汇总数据并转为矩阵

问题

我的手头有35万条数据,包含三个属性:时间、数量和ID。我现在需要以时间、ID分类,对数量进行求和统计(分类汇总);然后以time列为行(x轴),ID为列(y轴),num为值建立矩阵。

读取数据如下:
在这里插入图片描述
我们可以利用groupby函数进行分类汇总
以time,id为key进行分类,然后对num进行求和统计;得到的是Series数据

df1=df.groupby(["time","Id"])["num"].sum()

在这里插入图片描述
Series数据有两层索引,第一层为time,第二层为id,可以根据两者定位数据
在这里插入图片描述
可以利用stack和unstack将数据旋转成我们需要的格式

stack()即“堆叠”,作用是将列旋转到行
unstack()即stack()的反操作,将行旋转到列

两者默认都是对最里层索引处理,也就id层旋转。但是我们可以传入参数制定旋转的索引

df1=df1.unstack(1)#对最里层旋转

在这里插入图片描述

df1=df1.unstack(0)#对最外层旋转

在这里插入图片描述
当然也可以对DataFrame数据进行旋转,就变回了Series数据
在这里插入图片描述
在这里插入图片描述

代码

import pandas as pd

df = pd.read_csv("data.csv",encoding='utf8',dtype={"num": int})

df1=df.groupby(["time","Id"])["num"].sum()
df1=df1.unstack()
df1=df1.fillna(0).astype(int)

df1.to_csv("矩阵.csv",index = False)

欢迎关注本人的公众号:燕南路GISer ,专注GIS干货分享,不定期更新。
提问求资源等都可在公众号后台留言
后期CSDN的博客都会逐步迁移过去。

请添加图片描述

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

燕南路GISer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值