二、刻画离散程度的描述统计量
离散程度是指一组数据远离其中心值的程度。单纯以均值等中心值刻画数据,并非尽善尽美,还应该考察数据分布的疏密程度,即考察所有数据,相对于中心值分布的疏密程度。
如果数据都紧密地集中在中心值的周围,即数据的离散程度较小,则说明这个中心值是刻画全部数据的代表,中心值对数据的代表性好;相反,如果数据仅是比较松散的,分布在中心值的周围及数据的离散程度较大,则表明中心值是不具有代表性的。
因此,中心值和关于中心值的疏密程度共同作用,才能给出数据比较全面、完整的描述。
常见的刻画离散程度的描述统计量有样本标准,差样本方差等。
常见的刻画离散程度的描述统计量有:
1、样本标准差(Standard Deviation Std Dev)
样本标准差是表示变量取值距均值的平均离散程度的统计量。
样本标准差的数学定义为:
上式表明样本标准差刻画了数据关于均值的平均离散程度。样本标准差值越大,表明变量值之间的差异越大,距均值这个中心值的离散趋势越大。
样本标准差是有计量单位的。
2、样本方差(Variance)
样本方差也是表示变量取值离散程度的统计量。
样本方差的数学定义为
上式表明样本方差是样本标准差的平方。样本方差值越大,说明变量值之间的差异越大。
样本方差没有计量单位。
3、全距(Range)
全距也称为极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对差。全距是刻画变量所有取值离散程度的另一个统计量。在相同样本量情况下的两组数据,全距大的数据比全距小的数据分散。全距非常小,意味着数据基本都集中在一起。