pandas简介:
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
pandas数据结构:
1、series:
(1)构建series:
一维数组,与numpy中array类似,series中可以保存的数据类型:字符串、布尔、数字等。
#默认情况下,索引自增,也可以指定索引
~~~import pandas as pd
#创建一维数组
data=[10,20,30,40,50]
index=['a','b','c','d','e']
series1=pd.Series(data)
series2=pd.Series(data,index)
print('series1是:',series1)
print("series2是:",series2)
#结果:
series1是: 0 10
1 20
2 30
3 40
4 50
dtype: int64
series2是: a 10
b 20
c 30
d 40
e 50
dtype: int64
(2)series属性使用:
series1.index.name="索引"
series1.name="数据"
print(series1)
print("!!!!!!!!",series1.values)
print("???????",series1.index)
#结果:
索引
0 10
1 20
2 30
3 40
4 50
Name: 数据, dtype: int64
!!!!!!!! [10 20 30 40 50]
??????? RangeIndex(start=0, stop=5, step=1)
###### (3)series按索引取值:
series3=pd.Series({'a':[1,2],'b':[2,3],'c':[3,4],'d':[4,5]})
print(series3["a"])
print(series3[["a","d"]])
print(series3["a":"c"])
结果: