pandas 和核心是 Series 和 Dataframe 两大数据结构,数据分析的所有事务都是围绕这两种结构进行的。Series 数据结构是用于储存一个序列的一维数组,DataFrame 数据结构是用于存储复杂数据的二维数据结构。
结构
Series 类似于一维数组。内部是由两个相互关联的数组组成的,一个数组存放数据(值value),一个数组(index)存放索引。结构如下:
index | values |
---|---|
0 | 1600 |
1 | 12 |
2 | 1 |
常用操作
- 创建 Series 对象
pandas.Series(data[,index])
data 是输入给Series构造器的数据,可以是 NumPy 中任何类型的数据。
index 是索引,如果不输入的话默认是从 0 开始。