Python Pandas 高级数据操作 多层索引

本文介绍了Python Pandas库中关于多层索引的高级数据操作,包括如何创建多层索引、选择数据、执行交叉切片、重塑数据以及进行聚合操作。内容涵盖set_index()、pd.MultiIndex、loc和iloc的区别、交叉切片的使用、以及pivot、stack、unstack等重塑数据的方法,并提供了聚合操作如groupby、agg和transform的示例。
摘要由CSDN通过智能技术生成

1、创建多层索引

可以使用pd.MultiIndexset_index()创建多层索引。

1)set_index()

使用set_index()可以使用多个参数来实现不同的多层索引(层次化索引)操作。

参考说明:

参数

描述

keys

用于创建索引的列名或列名列表,可以是单个列名或多个列名。

drop

布尔值,指定设置索引后是否删除原来的列,默认为 True(删除)。

append

布尔值,指定是否将新索引添加到现有索引,默认为 False。

verify_integrity

布尔值,用于检查新生成的索引是否有重复项,默认为 False。

level

用于从多层索引中删除级别的整数或级别名。

inplace

布尔值,指定是否在原地修改 DataFrame,默认为 False。

col_level

用于确定将列插入到多层索引的哪个级别,

适用于具有多层列的 DataFrame。

col_fill

创建多层索引时,用于填充其他级别的名称。

使用示例:

import pandas as pd


# 创建示例 DataFrame
df = pd.DataFrame({
    'A': ['foo', 'bar', 'baz', 'foo'],
    'B': ['one', 'one', 'two', 'two'],
    'C': ['x', 'y', 'x', 'y'],
    'D': [1, 3, 2, 4]
})

# 使用 set_index() 示例
# 设置单列为索引
single_index_df = df.set_index('A')

# 设置多列为多层索引
multi_index_df = df.set_index(['A', 'B'])

# 设置索引并保留
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值