numpy中std和pandas中std的区别
-
偏差 (deviation): 样本中各数据比平均值大多少或小多少
-
方差 (deviation): 将偏差进行平方再取平均
-
标准差(standard deviation):标准差也即偏差的均方根值。
- 也就是所有数减去平均值,
- 它的平方和除以数的个数(或个数减一),
- 再把所得值开根号,就是1/2次方,
- 得到的数就是这组数的标准差。
-
计算得出的默认标准偏差类型在 numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的。
- 默认情况下,numpy 计算的是总体标准偏差,ddof = 0。
- pandas 计算的是样本标准偏差,ddof = 1。
- 如果我们知道所有的分数,那么我们就有了总体,因此,要使用 pandas 进行归一化处理,我们需要将“ddof”设置为 0。
-
总结
- 如是总体, 标准差公式根号内除以 n,
- 如是样本, 标准差公式根号内除以 (n-1),