Python学习笔记(10)Pandas统计分析3

1 使用pivot_table函数创建透视表

1.1 使用订单号作为透视表索引制作透视表

pd.pivot_table(DataFrame[['order_id', 'counts', 'amounts']], index = 'order_id')

1.2 修改聚合函数后的透视表

pd.pivot_table(DataFrame[['order_id', 'counts', 'amounts']], index = 'order_id', aggfunc= np.sum)

aggfunc默认为mean

1.3 使用订单号和菜品名称作为索引的透视表

pd.pivot_table(DataFrame[['order_id', 'dishes_name', 'counts', 'amounts']], index = ['order_id','dishes_name'], aggfunc= np.sum)

index为行分组键

1.4 指定菜品名称为列分组键的透视表

pd.pivot_table(DataFrame[['order_id', 'dishes_name', 'counts', 'amounts']], index = 'order_id', columns='dishes_name', aggfunc= np.sum)

columns为列分组键

1.5 指定某些列制作透视表

pd.pivot_table(DataFrame[['order_id', 'dishes_name', 'counts', 'amounts']], index = 'order_id', values='counts', aggfunc= np.sum)

1.6 填充透视表中的缺失值

pd.pivot_table(DataFrame[['order_id', 'dishes_name', 'counts', 'amounts']], index = 'order_id', columns='dishes_name',aggfunc= np.sum, fill_value=0)

缺失值填充为0,不赋值的话填充NaN

1.7 透视表中添加汇总数据

pd.pivot_table(DataFrame[['order_id', 'dishes_name', 'counts', 'amounts']], index = 'order_id', columns='dishes_name',aggfunc= np.sum, fill_value=0,margins = True)

赋值为True时,会出现命名为ALL的列

2 使用crosstab函数创建交叉表

pd.crosstab(index = DataFrame['order_id'], colunms=DataFrame['dishes_name'], values=DataFrame['counts'], aggfunc =np.sum,)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值