使用多级索引的关键是掌握有效数据转换的方法。Pandas有很多和stack()和unstack()类似的用法,可以合理的控制层级行列索引和在内容上保持不变的同时,按照需求进行行列转换。
1、有序的索引和无序的索引
如果MultiIndex不是有序的索引,那么大多数切片操作都会失败。
#创建一个不按字典顺序(lexographically)排列的多级索引Series
import numpy as np
import pandas as pd
index = pd.MultiIndex.from_product([['a', 'c', 'b'], [1, 2]])
data = pd.Series(np.random.rand(6), index=index)
data.index.names = ['char', 'int']
data
#如果想要对索引使用局部切片,那么错误就会出现
try:
data['a': 'c']
except KeyError as e:
print(type(e))
print(e)
#注:局部切片和许多其他相似的操作都要求MultiIndex的各级索引是有序的(即按照字典顺序由A至Z)
# 为此,Pandas提供很多便捷的操作完成排序,如sort_index()和sortlevel()
data = data.sort_index()
data
#索引排序好了之后的局部切片就可以正常使用了
data['a': 'b']
2、索引stack与unstack
我们可以将一个多级索引数据集转换成简单的二维形式