处理DataFrame数据——利用Groupby函数分类汇总数据并转为矩阵

问题

我的手头有35万条数据,包含三个属性:时间、数量和ID。我现在需要以时间、ID分类,对数量进行求和统计(分类汇总);然后以time列为行(x轴),ID为列(y轴),num为值建立矩阵。

读取数据如下:
在这里插入图片描述
我们可以利用groupby函数进行分类汇总
以time,id为key进行分类,然后对num进行求和统计;得到的是Series数据

df1=df.groupby(["time","Id"])["num"].sum()

在这里插入图片描述
Series数据有两层索引,第一层为time,第二层为id,可以根据两者定位数据
在这里插入图片描述
可以利用stack和unstack将数据旋转成我们需要的格式

stack()即“堆叠”,作用是将列旋转到行
unstack()即stack()的反操作,将行旋转到列

两者默认都是对最里层索引处理,也就id层旋转。但是我们可以传入参数制定旋转的索引

df1=df1.unstack(1)#对最里层旋转

在这里插入图片描述

df1=df1.unstack(0)#对最外层旋转

在这里插入图片描述
当然也可以对DataFrame数据进行旋转,就变回了Series数据
在这里插入图片描述
在这里插入图片描述

代码

import pandas as pd

df = pd.read_csv("data.csv",encoding='utf8',dtype={"num": int})

df1=df.groupby(["time","Id"])["num"].sum()
df1=df1.unstack()
df1=df1.fillna(0).astype(int)

df1.to_csv("矩阵.csv",index = False)

欢迎关注本人的公众号:燕南路GISer ,专注GIS干货分享,不定期更新。
提问求资源等都可在公众号后台留言
后期CSDN的博客都会逐步迁移过去。

请添加图片描述

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Python数据分析函数用法大全比较难以一次性全部列出,因为Python数据分析所使用到的函数非常多。但是,我可以列出一些常用的Python数据分析函数及其用法,帮助你更好地理解数据分析。 1. Pandas库中的常用函数 Pandas库是Python数据分析中常用的库之一,以下是一些常用的函数: - read_csv:读取CSV文件; - read_excel:读取Excel文件; - read_sql_query:执行SQL查询,并将结果读取到DataFrame中; - concat:将两个或多个DataFrame按行或列进行合并; - merge:将两个或多个DataFrame按照某一列进行合并; - groupby:按照某一列进行分组; - pivot_table:根据指定的行和列进行数据透视; - apply:对DataFrame中的每行或每列进行函数操作; - value_counts:计算Series中每个值出现的次数; - drop_duplicates:删除DataFrame中的重复行; - fillna:填充缺失值; - isnull:检查DataFrame中的缺失值; - plot:绘制图表。 2. Numpy库中的常用函数 Numpy库是Python数据分析中常用的库之一,以下是一些常用的函数: - arange:生成等差数列; - linspace:生成等间隔数列; - random:生成随机数; - reshape:改变数组形状; - concatenate:将两个或多个数组按行或列进行合并; - max:计算数组的最大值; - min:计算数组的最小值; - mean:计算数组的平均值; - sum:计算数组的总和; - argmax:返回数组中最大值的索引; - argmin:返回数组中最小值的索引; - dot:计算矩阵乘积。 3. Matplotlib库中的常用函数 Matplotlib库是Python数据分析中常用的可视化库之一,以下是一些常用的函数: - plot:绘制线图; - scatter:绘制散点图; - hist:绘制直方图; - bar:绘制柱状图; - pie:绘制饼图; - boxplot:绘制箱线图。 4. Seaborn库中的常用函数 Seaborn库是Python数据分析中常用的可视化库之一,以下是一些常用的函数: - distplot:绘制直方图和密度曲线; - pairplot:绘制多个变量之间的关系图; - heatmap:绘制热力图; - lmplot:绘制线性回归模型图; - boxplot:绘制箱线图。 以上是Python数据分析中常用的一些函数及其用法,但仅仅列出这些是远远不够的,因为Python数据分析所使用到的函数非常多,需要在实践中不断学习和积累。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

燕南路GISer

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值