方差:
当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。 [6]
样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。方差相应的计算公式为:
标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。
方差 手动计算公式
平均数:M=(x1+x2+x3+…+xn)/n (n表示这组数据个数,x1、x2、x3……xn表示这组数据具体数值)
总体方差公式:=〈(M-x1)^2;+(M-x2)^2;+(M-x3)^2;+…+(M-xn)^2;〉╱n
样本方差公式:=〈(M-x1)^2;+(M-x2)^2;+(M-x3)^2;+…+(M-xn)^2;〉╱(n-1)
样本方差需要 除以(n-1)
总体方差的excel 函数是 :=varp()
样本方差的excel 函数是:=var()
标准差:
所有数减去其平均值的平方和,所得结果除以该组数之个数(或个数减一,即变异数),再把所得值开根号,所得之数就是这组数据的标准差。
如是总体(即估算总体方差),根号内除以n,对应excel函数:=STDEVP();
如是抽样(即估算样本方差),根号内除以(n-1),对应excel函数:=STDEV();
因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。