集中趋势 (central tendency)
- 一组数据向其中心值靠拢的倾向和程度
- 测度集中趋势就是寻找数据水平的代表值或中心值
- 不同类型的数据用不同的集中趋势测度值
- 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据
集中趋势的度量
分类数据:众数(mode)
1. 众数
- 一组数据中出现次数最多的变量值
- 适合于数据量较多时使用
- 不受极端值的影响
- 一组数据可能没有众数或有几个众数
- 主要用于分类数据,也可用于顺序数据和数值型数据
2. 众数 (不惟一性)
- 无众数
原始数据: 10 5 9 12 6 8 - 一个众数
原始数据: 6 5 9 8 5 5 - 多于一个众数
原始数据: 25 28 28 36 42 42
顺序数据:中位数和分位数
1. 中位数 (median)
- 排序后处于中间位置上的值
- 不受极端值的影响
- 主要用于顺序数据,也可用数值型数据,但不能用于分类数据
- 各变量值与中位数的离差绝对值之和最小
2. 四分位数 (quartile)
- 排序后处于25%和75%位置上的值
- 不受极端值的影响