Pandas库--数据结构
引入Pandas包
import pandas as pd
Pandas数据结构
python的pandas库中数据结构有:
-
Series:
一维数组,与Numpy中的一维array类似,主要是由数组元素和与之对应的索引构成。Series如今能保存不同种数据类型,字符串、boolean值、数字等都能保存在Series中。 -
Time- Series:
以时间为索引的Series。 -
DataFrame:
二维的表格型数据结构。可以将DataFrame理解为Series的容器。 -
Panel :
三维的数组,可以理解为DataFrame的容器。 -
Panel4D:
四维数据容器。 -
PanelND:
拥有factory集合,可以创建像Panel4D一样N维命名容器的模块。
其中在数据处理方面最主要的两个的数据结构是:Series和DataFrame
一维Series
Series是一个类似一维数组的,他能够保存任何类型的数据,最简单的就是由一个数组和与之对应默认的索引值(0~N)组成
创建对象
pd.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)
其中:data是存放的数据;index是数据对应的索引值;dtype表示存放数据的类型(如int32、bool等);name为存入数据的名字;copy默认的值为false
(1)通过一维数组的方式创建
pd.Series([1,2,3,4,5])
运行的结果:
类似于一个对应索引值的表格
index | item |
---|---|
0 | 1 |
1 | 2 |
2 | 3 |
3 | 4 |
4 | 5 |