1、创建多层索引
可以使用pd.MultiIndex
和set_index()
创建多层索引。
1)set_index()
使用set_index()
可以使用多个参数来实现不同的多层索引(层次化索引)操作。
参考说明:
参数 |
描述 |
keys |
用于创建索引的列名或列名列表,可以是单个列名或多个列名。 |
drop |
布尔值,指定设置索引后是否删除原来的列,默认为 True(删除)。 |
append |
布尔值,指定是否将新索引添加到现有索引,默认为 False。 |
verify_integrity |
布尔值,用于检查新生成的索引是否有重复项,默认为 False。 |
level |
用于从多层索引中删除级别的整数或级别名。 |
inplace |
布尔值,指定是否在原地修改 DataFrame,默认为 False。 |
col_level |
用于确定将列插入到多层索引的哪个级别, 适用于具有多层列的 DataFrame。 |
col_fill |
创建多层索引时,用于填充其他级别的名称。 |
使用示例:
import pandas as pd
# 创建示例 DataFrame
df = pd.DataFrame({
'A': ['foo', 'bar', 'baz', 'foo'],
'B': ['one', 'one', 'two', 'two'],
'C': ['x', 'y', 'x', 'y'],
'D': [1, 3, 2, 4]
})
# 使用 set_index() 示例
# 设置单列为索引
single_index_df = df.set_index('A')
# 设置多列为多层索引
multi_index_df = df.set_index(['A', 'B'])
# 设置索引并保留