pandas
相比numpy更偏业务呈现,类似一个内存型的数据库,底层由numpy实现
其存储的数据类型为numpy.ndarray
1 初始化
Series初始化列,index可自定义
import pandas as pd
ser = pd.Series(['张三','李四','王五'],index= list(range(1,4)))
print(ser)
1 张三
2 李四
3 王五
dtype: object
通过字典初始化
data = {'Brett':176,'Eddy':187,'Kris':165}
ser5 = pd.Series(data)
print(ser5)
Brett 176
Eddy 187
Kris 165
dtype: int64
也可反向转化为字典
b = ser5.to_dict()
print(b)
{‘Brett’: 176, ‘Eddy’: 187, ‘Kris’: 165}
转化为列表,没有索引
b = ser5.to_list()
print(b)
[176, 187, 165]
转化为json
b = ser5.to_json()
print(b)
{“Brett”:176,“Eddy”:187,“Kris”:165}
转化为表格
b = ser5.to_frame()
print(b)
0
Brett 176
Eddy 187
Kris 165
2 通过索引取值
sec = ser[2] #2为索引不是下标
print(sec)
李四
取多个
ind = [1,3]
a = ser[ind]
print(a)
1 张三
3 王五
dtype: object
3 变更值
用索引变更值
ser[2] = 'Bach'
print(ser)
1 张三
2 Bach
3 王五
dtype: object
数值型运算
ser2 =pd.Series([17,18,19],index=[1,2,3])
ser3 =ser2+1 #所有数值+1
print(ser2)
print(ser3)
1 17
2 18
3 19
dtype: int64
1 18
2 19
3 20
dtype: int64
4 用条件筛选
ser4 = ser2[ser2%2==0] #筛选出ser2里的偶数输出
print(ser4)
2 18
dtype: int64