pandas进阶--pivot方法重塑Dataframe

欢迎关注公众号【Python开发实战】,免费领取Python学习电子书!

pivot方法

pivot方法介绍

方法形式为pivot(index=None, columns=None, values=None),返回由给定索引/列组织的重塑Dataframe。根据列值重塑Dataframe的数据,使用指定的索引/列的唯一值来形成结果的Dataframe的轴。但是不支持数据聚合,多个值会导致列中的MultiIndex。
在这里插入图片描述

参数解析:

  • index:str或object或str的列表(pandas 1.1.0版本之后可以接受列表),用于制作新Dataframe的索引,如果为None,则使用现在的索引。
  • columns:str或object或str的列表(pandas 1.1.0版本之后可以接受列表),用于制作新Dataframe的列。
  • **values:**str或object或str的列表,用于填充新Dataframe的值,如果未指定,将使用所有剩余的列,并且新Dataframe的列将具有多级索引。

返回:

  • 重塑的Dataframe。

引起ValueError:

  • 当按指定的index、columns和values取新Dataframe的值时,如果有多个值,会引起ValueError报错。

用例1

导入pandas

import pandas as pd
df = pd.DataFrame({
    'foo': ['one', 'one', 'one', 'two', 'two', 'two'], 
     'bar': ['A', 'B', 'C', 'A', 'B', 'C'], 
     'baz': [1, 2, 3, 4, 5, 6], 
     'zoo': ['x', 'y', 'z', 'q', 'w', 't']
})
df

输出:

image-20220423141450068

使用foo列的值作为新Dataframe的索引,使用bar列的值作为新Dataframe的列,使用baz列的值作为新Dataframe的值。

df.pivot(index='foo', columns='bar', values='baz')

输出:

image-20220423141730580

使用foo列的值作为新Dataframe的索引,使用bar列的值作为新Dataframe的列,values不指定,会指定剩余所有的列。

df.pivot(index='foo', columns='bar')

输出:

image-20220423141716713

对上面具有多级索引的Dataframe的进行索引取值。

df.pivot(index='foo', columns='bar')['baz']

输出:

image-20220423141655241

用例2

df2 = pd.DataFrame({
    'lev1': [1, 1, 1, 2, 2, 2],
    'lev2': [1, 1, 2, 1, 1, 2],
    'lev3': [1, 2, 1, 2, 1, 2],
    'lev4': [1, 2, 3, 4, 5, 6],
    'values': [0, 1, 2, 3, 4, 5],
})
df2

输出:

image-20220423141640061

index和columns传入列表。(需要pandas版本在1.1.0之后)

df2.pivot(index="lev1", columns=["lev2", "lev3"],values="values")

输出:

image-20220423141625670

df2.pivot(index=['lev1', 'lev2'], columns=['lev3'], values='values')

输出:

image-20220423141557640

用例3

df3 = pd.DataFrame({
    'foo': ['one', 'one', 'two', 'two'],
    'bar': ['A', 'A', 'B', 'C'],
    'baz': [1, 2, 3, 4],
})
df3

输出:

image-20220423141539844

如果指定index为foo,columns为bar,则df3的前两行是相同的,会引起ValueError报错。

try:
    df3.pivot(index='foo', columns='bar', values='baz')
except ValueError as e:
    print(e)

输出:

Index contains duplicate entries, cannot reshape
  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

凯旋.Lau

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值