数据分布的特征
1、集中趋势:各数据向中心值靠拢或聚集的程度;【平均数、中位数、四分位数、众数】
2、离散程度:各数据远离其中心值的趋势;【极差、四分位差、方差、标准差、离散系数】
3、分布形状:数据分布偏斜程度和峰度【偏态系数、峰态系数】
Excel表示:
平均数:AVERAGE()
中位数:median
众数:MODE()
四分位数:QUARTILE(,1) 1表示1/4位,2、3
极差:MAX()-MIN()
方差:Var()
标准差:stdev.s()
集中趋势的度量
集中趋势只是数据分布的特征,它所反映的是各变量值向其中心值聚集的程度。
一、平均数(mean)
一组数据相加后除以数据的个数所得到的结果 x̅(x-bar)
二、中位数(mediam)和众数()
中位数:一组数据排序后处于中间位置上的变量值
n个数据,n为奇数-直接选中间值为中位数
n为偶数,-(n+1)/2
四分位数:一组数据排序后处于25%和75%位置上的值
SPS:1=n+1/4 Q3:3(n+1)/4
Excel:Q1=(n+3)/4 Q3:(3n+1)/4
如果位置是整数,四分位数就是该位置对应的值;如果是在整数加0.5的位置上,则 四分位数取该位置两侧值得平均数&#x