pandas是python优秀的第三方库,提供高性能的数据类型和分析工具。pandas基于numpy实现,常与numpy与matplotlib库一起使用。
import pandas as pd
总的来说pandas有两个基本的数据类型:Series和DataFrame
争对这两个数据类型提供了以下这些操作:基本操作、特征类操作、运算类操作、关联分析类操作
pandas 的series类型
Series类型由一维数据与索引构成,如果没有指定索引,会自动添加索引,如果指定了索引,则索引在每一行最前面。
Series类型的创建
- python列表,index与列表元素个数一致,可以还说呢攻略index
a=pd.series([1,2,3,4])
a=pd.series([1,2,3,4],index=('one','two','three','four'))
- 数组,索引和数据都可以通过数组创建
a=pd.series(np.arange(5),index=np.arange(5,10,1))
- python字典,键是索引,index从字典中进行选择操作
a=pd.series({'a':1,'b':2,'c':3,'e':5},index=('a','b'))