为Series或DataFrame创建多级索引最直接的办法就是将index参数设置为至少二维的索引数组。分为隐式和显式的创建MultiIndex,隐式的MultiIndex的创建工作将在后台完成,显式的索引可以用pd.MultiIndex的方法更加灵活地构建多级索引。
1、隐式的创建(最直接)
df = pd.DataFrame(np.random.rand(4, 2),
index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]],
columns=['data1', 'data2'])
df
# 隐式的创建索引,同理,把元组作为键的字典传递给Pandas,Pandas也会默认转换为MultiIndex
data = {('California', 2000): 33871648 ,
('California', 2010): 37253956,
('New York', 2000): 18976457 ,
('New York', 2010): 19378102,
('Texas', 2000):20851820,
('Texas', 2010):25145561}
pd.Series(data)
2、显式地创建多级索引
#通过一个有不同等级的若干简单数组组成的列表来构建MultiIndex
pd.MultiIndex.from_arrays([[&#