一、np.var
数学上学过方差:
np.var()实际上是均方差,均方差的意义就是将方差进行了平均化,从而使得此值不会随着数据的增多而发生变化。
np.std()是标准差,np.std()的平方等于np.var(),标准差在高斯分布中用
表示。
不论是方差还是标准差,它们衡量的都是二阶中心矩。为什么是二阶而不是一阶?这是一个问题。
函数原型:numpy.var(a, axis=None, dtype=None, out=None, ddof=0, keepdims=)
计算张量a在axis轴上的方差
a:一个ndarray,不一定是一维
axis:可取值为None,int,int元组。当取值为None时,会把张量a展平成一维数组;当指定一个或多个int时,沿着axis指定的轴计算方差,其它轴的形状会保留。
dtype:在计算方差的时候使用的数据类型,如果a是int类型的张量,计算方差时也会使用float32类型
out:放置计算结果的数组,主要用于节省空间,out的维度必须保证正确
ddof:int,ddof是“Delta Degrees of Freedom”,表示自由度的个数,在计算方差时,分子是各个值和均值的差的平方之和,分母为(N-ddof)
keepdims:是否保留a的形状
返回值variance是一个ndarray
import numpy as npa =