pandas入门

目录

1. pandas数据结构介绍

(1)Series

(2)DataFrame

(3)Series与DataFrame的关系

2. 描述性统计的概述和计算


import pandas as pd  #导入

与numpy的联系与区别

pandas是在numpy基础上完成的

pandas用来处理表格或异质型数据,numpy用来处理同质性数据

1. pandas数据结构介绍

(1)Series

一维的数组对象,包含一个值序列(values)和索引(index)

obj=pd.Series([  ],index = [  ])  #生成

obj.values  #值

obj.index  #索引

obj[  ]  #索引和切片

注:obj2['b':'d']  #非默认索引切片时是左闭右闭

obj[  ]=    #修改

obj[obj>0]  #过滤

np.exp(obj)  #应用函数

obj2.drop(  )、obj2.drop([  ,  ])#删除  注:要重新赋名称

pd.isnull(obj)、pd.notnull(obj)、obj.isnull()  #检测缺失值

(2)DataFrame

数据表,包含已排序的列集合,每一列可以是不同的值类型

frame= pd.DataFrame(data, columns=[  ,  ], index=[  ,  ])  #生成

frame.head()  #选出前几行

data.loc[  , [  ,  ]]  #轴标签loc

data.iloc[  , [  ,   ,   ]]  #整数标签iloc

#删除行   和Series一样

del frame2[  ]、frame.drop(  ,axis=1)  #删除列

f = lambda x: x.max() - x.min()

frame.apply(f)  #对数据框每一行或每一列应用

(3)Series与DataFrame的关系

Series是DataFrame的一列

2. 描述性统计的概述和计算

df.sum()  #求和

df.mean(axis='columns', skipna=False)  #均值

df.idxmax()、df.idxmin()  #每一列的最大值或最小值的index

df.cumsum()  #累计值

df.describe()  #汇总统计

uniques = obj.unique()  #和Numpy一样

obj.value_counts()  #每个元素出现的次数

pd.read_csv("1.csv")  #从外部文件读入数据

pd.to_csv("2.csv")  #存数据到文件

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值