pandas基础介绍-命令模版
本文介绍pandas中一些常用的属性方法的概述,给读者提供快速学习的架构和思路。表格中提供的一些参数方法没有详细介绍,有需要查看官方文档。(由作者总结自最近看的书:Python for Data Analysis)
pandas 数据结构
- pandas用于装载一维数据的是Series,用于装载多维数据的是Dataframe,他们都有对应的索引对象Index Objects
- pandas的语法习惯与numpy有很多相通之处,区别在于numpy适合处理同质数据(即相同类型的数据),而pandas适合处理异质数据
Series
1. 创建Series数组
使用列表创建Series
使用字典创建Series,键为索引,值为数组。
# 用列表创建
pd.Series([0,1,2,3])
# 用字典创建
dict_ = {
'a':0,'b':1,'c':2}
s = pd.Series(dict_)
# Series 转化为字典
s.to_dict()
2. 性质
Series 由数组和索引两部分组成。其中索引若没有在生成时指定,则默认为从0开始的整数。Series和其索引都可以设置name属性。
a = pd.Series([0,1,2,3])
# 数组部分
a.array
#索引部分
a.index
#给Series命名
a.name
#给索引命名
a.index.name
3. 索引
可以在生成Series时,自己指定索引
#生成自己指定索引的Series
s = pd.Series([0,1,2,3],index=['a','b','c','d'])
#改变Series的索引
s.index = ['e','f','g','h']
4. 运算
- 通过切片索引出Series种某个或某几个元素
- 使用布尔数组过滤
- 使用加减乘除等标量操作计算
- 使用numpy中的数学函数计算
- 将Series看作字典做元素in运算
- 判断是否为空,为空运算 isna() notna()
#通过切片索引出Series种某个或某几个元素
s['a']
s[['c','b','a']]
#使用布尔数组过滤
s[s>1]
#使用加减乘除等标量操作计算
s*2
#将Series看作字典做元素in运算
'b' in s
#判断是否为空,为空运算
pd.isna(s)
pd.notna(s)
s.isna()
DataFrame
1. 创建Df数组
可以使用的输入数据创建Df数组的方法如下表
#使用列表的字典创建Df
list_dict = {
'a'