[pandas]数据重塑与透视

本文详细介绍了Pandas的数据重塑和透视操作,包括数据透视的整理和聚合,数据堆叠与解堆,交叉表的统计,轴交换,数据融合,虚拟变量的生成,因子化过程,以及如何进行列表爆炸等操作。内容深入浅出,适用于进阶Pandas使用。
摘要由CSDN通过智能技术生成

一.数据透视.

1.1整理透视

df.pivot(index = ' ', columns = ' ',values = ' ')

这些参数传入的是原数据的列名。index如果不传入,会使用现有索引。columns作为新DataFrame的列,取去重的值,当列和索引的组合有多个值时会报错,需要用pd.pivot_table()进行操作。values作为新DataFrame的值,若指定多个,会形成多层索引,若不指定,会默认为所有剩余的列。

1.2聚合透视

df.pivot()只是对原数据的结构、显示形式做了变换。若要在数据透视过程中对值进行计算,可以使用pd.pivot_table()

 margins:是否增加汇总行列

aggfunc可以为不同的列指定不同的计算方法,用字典的形式给出就可

2.数据堆叠 stack

2.1堆叠与解堆

堆叠示意:

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值