利用python进行数据分析
第五章:pandas入门
第五节,层次化索引
层次化索引(hierarchical indexing)可使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。
>>> data=Series(np.random.randn(10), index=[['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'], [1,2,3,1,2,3,1,2,2,3]])
>>> data
a 1 -1.800271
··2 -0.870764
··3 0.600804
b 1 -0.643546
··2 -0.355527
··3 1.599922
c 1 0.213821
··2 2.210991
d 2 -0.309903
··3 0.130301
dtype: float64
>>> data.index
MultiIndex(levels=[[u'a', u'b', u'c', u'd'], [1, 2, 3]], labels=[[0, 0, 0, 1, 1, 1, 2, 2, 3, 3], [0, 1, 2, 0, 1, 2, 0, 1, 1, 2]])
结果是索引之间的“间隔”表示“直接使用上面的标签”
>>> data['b']
#选取外层索引
1 -1.871382
2 -0.941952
3 -0.571710
dtype: float64
>>> data['b', 1]
#选取外层索引+内层索引,或data['b'][1]
-1.8713820461721136
>>> data['b':'c']
>>>> data.