在pandas的DataFrame中经常使用多个索引,在pandas中成为MultiIndex对象,这篇文章介绍一下MultiIndex创建和使用方法:
-
引入所有需要的模块
-
创建两个<type 'numpy.ndarray'>对象,分别为colors和foods
-
打印出这两个数组来查看一下,注意tm.choice创建的数组是随机的,你利用同样的代码创建的数组和我的可能不一样
-
创建MultiIndex对象,然后创建DataFrame对象(其中使用index=index参数)
-
打印一下df看看里面的数据:有两个索引color和food
-
如何利用索引来筛选数据:使用query()结果为:
-
还可以在分组中使用索引,使用了level参数打印结果为:
-
删除或者更改索引的名称:如果删除了名称,我们只能使用ilevel_0表示第一个索引打印结果为:
-
分组中也是一样,删除掉索引名称以后,只能使用数字1表示第二个索引打印结果为:
本文转载自http://jingyan.baidu.com/article/73c3ce28f0d58fe50343d9c4.html