平均数让我们看到一组数据的集中趋势,那么进一步了解数据的分布,也就是分散性与变异性则需要以下这些统计量。
一、全距
1、计算方法
全距=上界-下界
2、含义
全距表示一组数据的宽度,用极大值减去极小值得到。可以简单衡量一组数据的分散程度。
全距越小,数据分散度越小。
3、优缺点
优点:简单易操作。
缺点:极易受到异常值的影响。
二、四分位距
1、计算方法
将一组数从小到大排序,分成四等份。每等份之间的数叫做四分位数
,依次记作Q1、Q2、Q3。
四分位距=Q3-Q1。
2、含义
四分位距表示一组数从小到大,最中间的50%的数的宽度。亦可以简单衡量一组数据的分散程度。
四分位距越小,数据分散度越小。
3、优缺点
优点:改进了全距易受异常值影响的缺陷,可将异常点排除在外。
缺点:不能使用所有数据信息,只用到了部分数据。
4、百分位数
将一组数从小到大排序,分成100等份。每等份之间的数叫做百分位数
,第k百分位数就是处于数据范围k%处的数值,用Pk表示。
三、方差和标准差
1、计算方法
σ 2 = Σ ( x − μ ) 2 n \sigma ^{2}=\frac{\Sigma (x-\mu )^{2}}{n} σ