目录
- 集中趋势
- 众数 M o M_o Mo
- 中位数 M e M_e Me
- 均值(算术、加权、几何 x ˉ G \bar{x}_G xˉG、切尾)
- 众数 & 中位数 & 均值的关系
频数分布仅对数据作了简单的概括,丢失了大量信息。统计图能直观展示数据,但需要更有说服力的信息支持,因此需要更多的统计方法。
集中趋势
1.众数(单众、双众、多众、无众)
一组数据中出现次数最多的变量值,用 M o M_o Mo表示。
通常用来近似反映社会经济现象的一般水平。如某次考试成绩最集中的水平、城镇居民最普遍的生活水平、当前最流行的潮流等。
计算众数
- 未分组数据 & 分类频数分布表
排序、观察/统计出现次数量最多的 - 分组频数分布表
常用的两种计算方法:- M o = L + U 2 , L 为 众 数 所 在 组 下 限 , U 为 上 限 M_o = \frac{L + U}{2},L为众数所在组下限,U为上限 Mo=2L+U,L为众数所在组下限,U为上限。
- M o = L + f m − f m − 1 ( f m − f m − 1 ) + ( f m − f m + 1 ) ∗ i M_o = L + \frac{f_m - f_{m-1}}{(f_m - f_{m-1}) + (f_m - f_{m+1})} * i Mo=L+(fm−fm−1)+(fm−fm+1)fm−fm−1∗i i 为 组 距 , f m 为 众 数 所 在 组 频 数 , f m − 1 为 上 一 组 频 数 , f m + 1 为 下 一 组 频 数 i为组距,f_m为众数所在组频数,f_{m-1}为上一组频数,f_{m+1}为下一组频数 i为组距,fm为众数所在组频数,fm−1为上一组频数,fm+1为下一组频数。
说明:
- 众数是唯一可以研究分类数据集中趋势的统计量
- 主要用于分类数据,如国家的个人所得税的征收政策制定、房地产的房屋格局规划、农贸市场商品价格等
- 众数能传递的信息量非常有限,比如通过众数可了知道一个值出现的次数最多,但多的程度无法知道(在众数眼里,100:1 & 100:99是一样的)
- 适合数据较多时使用
- 图表中容易获取变量的众数
2.中位数
一组数据排序后,中间的那个值,用 M e M_e M