pandas常用数据结构series和方法
- 通过pandas.series来创建series数据结构
- pandas.series(data,index,dtype,name)
- data可以为列表,array或者dict
- index表示索引,必须与数据同长度,name代表对象的名称
建立series的三种方式
1.通过列表来建:
import numpy as np
import pandas as pd
series1 = pd.Series([2,8,3.01,4.8,9.7,8.0])
添加index和name试一试
series2 = pd.Series([1.3,3.5,9,3.5,5],index=['a','b','c','d','e'],name='这是一个序列')
输出为:
a 1.3
b 3.5
c 9.0
d 3.5
e 5.0
Name: 这是一个序列, dtype: float64
2.通过一维数组来创建
s1 = np.random.rand(4)
series3 = pd.Series(s1,index=['ha','ou','im','ta'])
结果为:
ha 0.483493
ou 0.406390
im 0.786722
ta 0.910779
dtype: float64
3.通过字典来创建
series4 = pd.Series({'北京':2.5,'上海':3.01,'广东':5.8,'山西':7.8})
结果:
北京 2.50
上海 3.01
广东 5.80
山西 7.80
dtype: float64
访问方式:
series4[1:3] #左闭右开,从零开始的
上海 3.01
广东 5.80
dtype: float64
这种通过索引名称(即字典中的键值),即通过位置来访问的话,就是左闭右闭的
series4['上海':'山西']
结果为:
上海 3.01
广东 5.80
山西 7.80
dtype: float64
输出值
series4.values
array([2.5 , 3.01, 5.8 , 7.8 ])
输出索引
series4.index
Index(['北京', '上海', '广东', '山西'], dtype='object')