Pandas库:从入门到应用(四)--数学函数

一、测试数据
import numpy as np
import pandas as pd

## 5行3列 0到100的数据
df = pd.DataFrame(data=np.random.randint(0, 100, size=(5, 3)))
df

在这里插入图片描述

二、基础聚合函数
2.1、count()函数
df.count()  # 统计每列的行数(非空),默认axis=0
df.count(axis=1) # 统计每行的列数(非空)

在这里插入图片描述

2.2、max()与min()函数
df.max()  # 默认求在每一列中不同行之间的最大值
df.min()  # 默认求在每一列中不同行之间的最小值

df.max(axis=1) # 默认求在每一行中不同列之间的最大值
df.min(axis=1) # 默认求在每一行中不同列之间的最小值

在这里插入图片描述

在这里插入图片描述

2.3、median() 中位数
df.median()  # 求每列中位数
df.median(axis = 1)  # 求每行中位数

在这里插入图片描述

2.4、sum() 求和
df.sum()  # 求每列和
df.sum(axis=1) #求每行和
df.values.sum()  # 求所有元素的和

在这里插入图片描述

2.5、mean() 求平均值
df.mean() # 求每列平均值
df.mean(axis=1) # 求每行平均值

在这里插入图片描述

2.6、value_counts() 统计元素出现次数
df[1].value_counts()  # 统计第1列元素出现次数
##添加参数 normalize=True
df[1].value_counts(normalize=True)  # 统计元素出现占比

在这里插入图片描述

2.7、cumsum() 累加
df.cumsum()  # 累加 默认axis = 0 是列

在这里插入图片描述

2.8、cumprod() 累乘
df.cumprod()  # 累乘 默认axis = 0 是列

在这里插入图片描述

三、高阶函数
  • ​ 方差:
    • ​ 当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;
    • ​ 当数据分布比较集中时,各个数据与平均数的差的平方和较小。
    • ​ 因此方差越大,数据的波动越大;方差越小数据的波动就越小
  • ​ 标准差
    • ​ 标准差 = 方差的算术平方根
3.1、var()方差
df.var()  # 方差
df.var(axis = 1)  # 方差

在这里插入图片描述

3.2、std()标准差
df.std()  # 标准差
df.std(axis = 1)  # 标准差

在这里插入图片描述

  • ​ 协方差
  • ​ 两组数值中每对变量的偏差乘积的平均值
  • ​ 协方差>0 : 表式两组变量正相关
    • ​ 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;
  • ​ 协方差<0 : 表式两组变量负相关
    • ​ 如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
  • ​ 协方差=0 : 表式两组变量不相关
3.3、cov() 协方差
df.cov()  # 协方差
df[0].cov(df[1])   # 第0列和第1列的协方差

在这里插入图片描述

  • 相关系数r
  • 相关系数 = X与Y的协方差 / (X的标准差 * Y的标准差)
  • 相关系数值的范围在-1和+1之间
  • r>0为正相关,r<0为负相关。r=0表示不相关
  • r 的绝对值越大,相关程度越高
3.4、corr() 所有特征相关系数
df.corr()  # 所有特征相关系数
df.corrwith(df[2])  # 单一特征相关系数

在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值