Pandas 与 Numpy 中的std() var() 区别

方差(Variance):一个随机变量方差描述的是它的离散程度,也就是该变量离其期望值的距离。将各个误差将之平方(而非取绝对值,使之肯定为正数),相加之后再除以总数。公式如下:

\operatorname{Var}(X) = \operatorname{E}\left[(X - \mu)^2 \right]

 

pandas官方文档对 var() 定义:DataFrame.var(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

 

pandas 默认 ddof=1, 即分母为N-1,这样的样本方差是总体方差的无偏估计。这被称为贝塞尔修正。

{\displaystyle s^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}}

 

numpy官方文档var() 定义: numpy.var(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=<no value>)

numpy默认 ddof=0, 即分母为N。

 

标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),数学符号σ(sigma),在概率统计中最常使用作为测量一组数值的离散程度之用。标准差定义:为方差算术平方根,反映组内个体间的离散程度;标准差与期望值之比为标准离差率

pandas官方文档对 std() 定义:DataFrame.std(axis=Noneskipna=Nonelevel=Noneddof=1numeric_only=None**kwargs)

numpy.std(aaxis=Nonedtype=Noneout=Noneddof=0keepdims=<no value>)

\ SD= \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2}

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值