1.pandas基本数据结构
pandas有两种基本的数据结构:Series,DataFrame
1.1:Series:是一种根据一维数组创建的对象,由一为数组和一组索引组成。并且索引值是可以重复的。
1.2:DataFrame:是一个表格型数据结构,一维数组不能够直接使用,需要先将自身利用reshape(-1,1)转变为二维数组方可使用。DataFrame可以看作是Series的聚合体,比起单独的Series多了一个区分的列名。
2.Series使用
2.1 创建
Series可以通过numpy一维数组和普通以为数组创建皆可。
而且还可以通过字典创建,键为索引index,值为values。
Series(np.array([1,2,3,4]))
Series([1,2,3,4])
有两种属性,索引index和值values,还可以使用dtype=设定values的类型。
例如
series=Series([1,2,3,4],dtype=float64,index=['first','second','third','fourth'])
#也可以在创建对象后再进行修改
series.index=['s','s','s','s']
2.2获取值
可以通过下标和索引两种方式获取索引值
series[0]
series['s&#