离中趋势
- 数据分布的另一个重要特征
- 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度
- 不同类型的数据有不同的离散程度测度值
离散程度的度量
分类数据:异众比率
异众比率 (variation ratio)
- 对分类数据离散程度的测度
- 非众数组的频数占总频数的比例
- 用于衡量众数的代表性
顺序数据:四分位差
四分位差 (quartile deviation)
- 对顺序数据离散程度的测度
- 也称为内距或四分间距
- 上四分位数与下四分位数之差
- Qd = QU – QL
- 反映了中间50%数据的离散程度
- 不受极端值的影响
- 用于衡量中位数的代表性
数值型数据:方差和标准差
1. 极差 (range)
- 一组数据的最大值与最小值之差
- 离散程度的最简单测度值
- 易受极端值影响
- 未考虑数据的分布
2. 平均差 (mean deviation)
- 各变量值与其平均数离差绝对值的平均数
- 能全面反映一组数据的离散程度
- 数学性质较差,实际中应用较少