集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如测试班级的平均成绩是多少?是正偏分布还是负偏分布?
离中趋势分析主要靠全距、四分差、平均差、方差、标准差等统计指标来研究数据的离中趋势。例如,当我们想知道两个教学班的语文成绩,哪个班级的成绩分布更分散时,就可以用两个班级的四分差或百分点来比较。
注:四分差
1.四分位差(quartile deviation),它是上四分位数(QU,即位于75%)与下四分位数(QL,即位于25%)的差的平均值。
2.计算公式为:Qd = (QU-QL) / 2
3.四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。
4.四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数,即中位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的差的一半又称为四分位差,记为Q。四分位差越小,说明中间部分的数据越集中;四分位差越大,则意味着中间部分的数据越分散。