第四章 Pandas变形

一、透视表

  1. pivot
  2. 透视表是一种可以对数据动态排布并且分类汇总的表格格式
    通过index,coloumn,value信息,pivot函数可以对数据表进行重新重塑
    其中行与列两个参数是必须要有的
    例如:我想以学号作为索引,查看男女生的身高情况
df.pivot(index='ID',columns='Gender',values='Height').head()

另外pivot不是很灵活,下面这个更加常用
2. pivot_table
pivot_table有四个最重要的参数index、values、columns、aggfunc
其中columns是一个可选的参数,同index一样,它代表列的层次
以下例子会让四个值慢慢添加,注意比较区别
例如:以学号作为索引进行查看(index)

pd.pivot_table(df,index='ID').head()
  1. crosstab
    交叉表示用于统计分组频率的特殊透视表
    例如:我想统计相同住在同一个地方的男生或女生数量(街道和性别分组的频数)
pd.crosstab(index=df['Address'],columns=df['Gender']).head()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值