最近工作中,有时会遇到数据转化的问题,这块知识之前掌握得比较零散,今天花时间整理了下
数据来源于下jizhang/pandas-tidy-datagithub.com
一.层级索引
层级索引可以作为增加维度的方法,也是行列转换的关键,Pandas原有的数据类型包括Series,DataFrame
Series可以看成是一维数组+索引
DataFrame可以看成是多个Series组成的二维数组
那么如果用实现比二维更高的数据,就可以使用层次索引
例如,如果我们想用Series实现二维数据,可以增加一层索引
In[13]: data = {
('California', 2000): 33871648,
('California', 2010): 37253956,
('Texas', 2000): 20851820,
('Texas', 2010): 25145561,
('New York', 2000): 18976457,
('New York', 2010): 19378102
}
pd.Series(data)
Out[13]:
California 2000 33871648
2010 37253956
New York 2000 18976457
2010 19378102
Texas 2000 20851820
2010 25145561
dtype: int64
<