数据结构介绍
名称 | 说明 |
---|---|
Series | 一维带标签的同种数据类型的数组 |
DataFrame | 二维带标签的大小可变的各列数据类型可以不同的二维表格 |
Panel | 三维带标签大小可变的数组 |
可以把DataFrame看作Series的容器,把Panel看作是DataFrame的容器
序列
Series的生成方式是多种多样的,可以用numpy去生成一个序列
>>> s = pd.Series(np.random.rand(5))
0 0.350976
1 0.735377
2 0.330421
3 0.466046
4 0.749564
dtype: float64
打印出来的序列,左边是标签,右边是值。默认情况下索引从0开始。可以用Index和values属性得到索引和数据。
>>> s.index
RangeIndex(start=0, stop=5, step=1)
>>> s.values
array([0.35097618, 0.73537748, 0.33042106, 0.46604558, 0.74956398])
可以在创建序列的时候同时声明索引(支持重复索引)
>>> s = pd.Series(np.random.rand(5), index=['a','b','c','d','a'])
a 0.694635
b 0.068107
c 0.302411
d 0.044751
a 0.858449
dtype: float64
也可以使用字典生成,没有指定索引值的情况下,默认采用关键字作为索引值
>>> b = {