一:Pandas的数据结构分析
Pandas中有两个主要的数据结构,分别是Series和DataFrame
(1).Series:一维的数据结构,它能保存任何类型的数据,主要由一组数据和相关的索引两部分组成,创建方法:{Series类对象创建方法:class pandas.Series(data=None,index=None,dtype=None,name=None,copy=False,fastpath=False);创建Series类对象:ser_obj=pd.Series([1,2,3,4,5]);创建Series类对象并指定索引:ser_obj=pd.Series([1,2,3,4,5]),index=['a','b','c','d','e'];使用dict构建:year_data={2001:17.8,2002:20.1,2003:16.5} ser_obj2=pd.Series(year_data)};获取ser_obj的索引:ser_obj.index,获取ser_obj的数据:ser_obj.values,获取位置索引3对应的数据:ser_obj[3]
(2).DataFrame:二维的、表格型的数据结构,它没列的数据可以是不同的数据类型,创建方法:{pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False),通过传入数组来创建DataFrame类对象:创建数组demo_arr=np.array([['a','b','c'],['d','e','f']]),基于数组创建DataFream对象df_obj=pd.DataFrame(demo_arr),通过列索引的方法获取一列数据element=d