我们经常在接触的都是一维数据和二维数据,用Pandas的Series和DataFrame对象就可以储存。还有不常接触的三维和四维数据,Pandas也提供了Panel和panel4D对象储存。 在实践中,更直观的形式是通过层级索引(hierarchical indexing,也被称为多级索引,multi-indexing)配合多个有不同等级的一级索引一起使用,这样就可以将高维数组转换成类似一维Series和二维DataFrame对象的形式。
一维的Series对象表示二维数据-----用一系列包含特征与数值的数据点演示。
1、传统办法(笨办法)
这是一种复杂的对元组清理的办法,在面对较大数据量的时候会有不够高效的问题,而pandas对待同样的问题会有更加简洁的办法。
import numpy as np
import pandas as pd
index = [('California', 2000), ('California', 2010),
('New York', 2000), ('New York', 2010),
('Texas', 2000), ('Texas', 2010)]
populations = [33871648, 37253956,
18976457, 19378102,
20851820, 25145561]
pop = pd.Series(populations, index=index)
#pop进行切片查询
pop[('California', 2010): ('Tex