1 数据的集中趋势
均值:易受极值的影响,可以使用加权平均值来消除极值的影响,但是可能事先并不清楚数据的权重。
中位数:描述了数据的中等水平,对数据变化不敏感
众数:众数不受极值的影响,但是无法保证唯一性和存在性
excel函数:AVERAGE、MEDIAN、MODE函数分别计算均值、中位数和众数。
求中位数也可以使用QUARTILE.EXC或QUARTILE.INC函数,将第二个参数设置为2。
2 数据的离散趋势
极值:极大值、极小值,在Excel中,计算极值的函数是MAX和MIN。
极差:又称“全距”,极大值 - 极小值 ,记作R;极差越大,离散程度越大。
四分位距离: IQR = Q_3 - Q_1
方差:表示数据与期望值的偏离程度。方差越大,就意味着数据越不稳定、波动越剧烈,因此代表着数据整体比较分散,呈现出离散的趋势;而方差越小,意味着数据越稳定、波动越平滑,因此代表着数据整体比较集中。
在Excel中,计算总体方差和样本方差的函数分别是VAR.P和VAR.S。