Python 之 Pandas 库使用教程

Pandas 库的使用

使用pandas 库必须要了解其两大数据结构 Series 和DataFrame。

主要内容:

  • Series 的创建
  • Series 的查询和运算
  • Series 的其他功能行命令
  • DataFrame 的创建
  • DataFrame 的查询,合并,赋值 排序等
  • DataFrame 的其他功能

一, Series 的创建方式

Note:可以将其看做是一个带有标号的以为数组,其具有行索引。
创建的方式有三种: Python 的dic 字典,numpy 中的ndarray 和具体的数值。
1,通过 python 的dic 创建
在这里插入图片描述
2,通过 numpy 中的narray 创建

3,通过具体的值来创建
在这里插入图片描述

二,Series 的常见操作

查询操作两种方式 通过绝对的位置查询和通过标签查询
在这里插入图片描述
在这里插入图片描述

三,Series 的运算操作

运算操作 + - * 、 exp和关系运算,它们都是两个的Series 对应位置的操作,在选取部分Series 进行操作的时候,一定注意index 相同,不同的位置运算为NAN。

四,Series 的其他功能运算

se.unique() 获取series数据中的数值种类
se.value_counts() 统计series数据中的数据种类以及对应数据的个数
se.mean() 计算series数据的均值
se.std() 计算series数据的标准差
se.median()计算series数据的中位数
se.max() 计算series数据的最大值
se.min() 计算series数据的最小值
se.count() 计算series数据的个数

五,DataFrame 创建

Note:可以将其看为一个二位的数组其行索引为index 列索引为columns。 一般的创建形式为: pd.DataFrame(data, columns= , index= )
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

五,DataFrame 赋值 排序等

DataFrame 的赋值操作
df[‘A’]=np.array([1]*len(df)) ##用数组给某列赋值
df.loc[:,[‘a’,‘c’]]=[] ##根据位置赋值
##知道如何取数,就能轻松给数据框赋值啦。

DataFrame 的排序操作
df.sort_values(by=‘column_Name’,ascending=True) ##按某列升序排序
df.sort_index(axis=1,ascending=True) ##索引排序

六,DataFrame 的其他功能:

DF.head() 查看数据框DF数据前几行
DF.tail() 查看数据库DF数据后几行
DF.info() 查看数据框DF总体信息
DF.describe() 查看数据框DF的各项统计信息
DF.index 查看数据框DF的行索引
DF.columns 查看数据框的列名
DF.shape 查看数据框的形状,行和列

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值