Pandas介绍:
pandas是一个强大的Python数据分析的工具包,是基于NumPy构建的。
Pandas的主要功能:
1)具备对其功能的数据结构DataFrame、Series
2)集成时间序列功能
3)提供丰富的数学运算和操作
4)灵活处理缺失数据
python里面安装、引入方式:
安装方法:pip install pandas
引用方法:import pandas as pd
Series数组的创建:
创建空的的值
importpandas as pd
s=pd.Series()print(s) #Series([], dtype: float64)
传入一个列表
data=['a','b','c','d']
res=pd.Series(data)print(res)'''结果
0 a
1 b
2 c
3 d
这里没有传递任何索引,因此默认情况下,它分配了从0到len(data)-1的索引,即:0到3'''
传一个字典
data = {'a' : 0, 'b' : 1, 'c' : 2}
s=pd.Series(data)print(s)'''结果
a 0
b 1
c 2
dtype: int64
注意 - 字典键用于构建索引。'''
从标量创建索引:
如果数据是标量值,则必须提供索引。将按照索引重复该值进行匹配
res=pd.Series(0, index=['a','b','c','d'])print(res)'''结果
a 0
b 0
c 0
d 0'''
自指定索引值:
res=pd.Series(['a','b','c','d'],index=['a_index','b_index','c_index','d_index'])print(res)'''结果
a_index a
b_index b
c_index c
d_index d'''
从具有位置的系列中访问数据(取值):
重点理解:数组是从零开始计数的,第一个位置存储再零位置)
查看index 、 values的值:
#查看数组的index值
print(res.index)#查看数组的value值
print(res.values)#取值(根据默认第零位开始取)
print(res[0]) #a
取前三个值(不包括定义的最后一个数值)
res=pd.Series(['a','b','c','d'],index=['a_index','b_index','c_index','d_index'])#取前三个值(不包括3)
print(res[:3]) #是个对象可以 res[:3].values
'''结果
a_index a
b_index b
c_index c
dtype: object
'''
取后三个值:
print(res[-3:])'''结果
b_index b
c_index c
d_index d
dtype: object'''
使用索引标签检索数据并设置数据:
修改value值
res=pd.Series(['a','b','c','d'],index=['a_index','b_index','c_index','d_index'])print(res)
res['a_index']='new_a'
print(res)'''结果
a_index new_a
b_index b
c_index c
d_index d'''
copy复制数据并修改
sr1=pd.Series([12,13,14],index=['c','a','