Pandas库主要针对Series和DataFrame两种数据结构进行操作,一般与Numpy同时导入:
一、Series
1、Series的定义与使用
Series 是一个带有名称和索引(显性)的一维数组
Series 中包含的数据类型可以是整数、浮点、字符串、列表、元组、ndarray等
创建方式:pd.Series(['data=None', 'index=None', 'dtype=None', 'name=None'],)
从上面显示的dtype可以看出,和ndarray一样,Series中只能保存一种数据类型,如果数据类型不一致的话,也会自动转化为一致,转化的规则和ndarray类似:
注:如果在Pandas对象中dtype被标记为“object”,大概率是字符串,以及非数值型的数据类型
2、Series索引标签及添加
方法一:在创建Series对象的时候添加
定义之后就可以查看Series的索引标签:
方法二:建立好Series之后,用一个新的列表(或者其他有序序列)赋值到该Series的索引对象Index中
3、Series的名字及添加
方法一:在创建Series对象的时候添加
方法二:建立好Series之后,通过改变Series实例属性的方式来添加
4、Series索引名字的添加
通过index.name属性添加
5、Pandas的Index对象
综上所述,一个Series包括了data,index 以及 name,但是按照上面的方法,定义一个完整元素的 Series 的索引,需要先定义索引标签,再定义索引的名字,未免太繁琐。可以通过定义 Index 对象,再将其赋值到Series 中的 index 参数,这样可以一次性定义一个有完整元素的Series索引
6、Series的索引和切片
索引标签的添加并不会删除索引,索引依然可以使用,也可以通过索引标签进行切片:
注意:切片方法有点差异,用索引是不取末端,用索引标签取末端