上一篇推文中,我向大家介绍了集中趋势统计量,以及它们在3种不同软件中的计算方法。但集中趋势统计量只能够描述数据的集中趋势,一些数据的集中趋势统计量相似,但数据分布形态却可能千差万别;因此,要想进一步判断数据的整体情况,还需要了解数据的离散程度。
离散程度是指一组数据,远离其中心的程度,离散程度统计量一般与集中趋势统计量结合起来描述数据的整体情况。判断数据的离散程度通常需要参考以下统计量:
极差(range):也称全距,一组数据最大值与最小值的差。
四分位数(Quartile ):将一组数据等分为四部分的三个数字:下四分位数,中位数,上四分位数。
百分位数( Percentiles ):四分位数将一组数据分为四部分。也可以将一组数据分成更多的部分,例如,五分位数将一组数据分成五部分,十分位数将一组数据分为十部分。而百分位数,将一组数据分成一百组,其中第35百分位数,是将下部35%的数值和上部65%的数值分开的数。
四分位距(Interquartile Range, IQR):上四分位数与下四分位数的差;反映