标准差是衡量观测值相对平均值的分散程度。较大的标准差,说明观测数组的相对均值的波动比较大。
如果观测值是总体,标准差根号内除以n,如果是样本,标准差公式根号内除以n-1,因为我们大量接触的是样本所以基本都是除以n-1,除以的这个数字又叫做自由度。
numpy.std(a, axis=None, dtype=None, out=None, ddof=0, keepdims=
参数
- a : array_like
计算的数据 - axis : None or int or tuple of ints, optional
默认是计算平铺的数组,可以选择计算的方向 - dtype : dtype, optional
调节计算的精度 - out : ndarray, optional
输出选择 - ddof : int, optional
控制自由度,自由度=N - ddof,N是数据的长度。当ddof=1时,就是样本标准差,当ddof=0时,是总体标准差 - keepdims : bool, optional
返回
standard_deviation : ndarray, see dtype parameter above.
注意
在R语言中sd()函数返回的是样本标准差,既自由度是n-1