方差,标准差含义:https://www.jianshu.com/p/fbfe6819b696?utm_campaign
计算得出的默认标准偏差类型在 numpy
的 .std()
和 pandas
的 .std()
函数之间是不同的。
默认情况下,numpy
计算的是总体标准偏差,ddof = 0
。另一方面,pandas
计算的是样本标准偏差,ddof = 1
。如果我们知道所有的分数,那么我们就有了总体——因此,要使用 pandas
进行归一化处理,我们需要将“ddof
”设置为 0
。
在统计学中,多年的经验总结出:
- 如是总体,标准差公式根号内除以 n,
- 如是样本,标准差公式根号内除以 (n-1),
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。
公式意义 :所有数减去平均值,它的平方和除以数的个数(或个数减一),再把所得值开根号,就是1/2次方,得到的数就是这组数的标准差。