位置平均数:集中趋势之稳健表达
一、中位数
1.定义:将变量值按大小次序排列,处于中间位置的变量值即为
中位数-Me
[例]某科室由9人组成,其年龄分别为:24,25,25,26,26,27,28,29,55
2.计算
(1)当资料未分组时,中点位置=(n+1)/2;
当n为奇数时, Me =中间位置的那个变量值;
当n为偶数时, Me =中间位置两侧的两个变量值的简单平均。
3.注意的问题
(1)不受极端值的影响,比较稳健。
(2)中位数的取值只与中间位置的一或两个数值有关,利用信
息不充分,忽略了其它数据的大小,并且不适合于代数运算。
二、四分位数
2.不受极端值的影响
三、众数(Mo)
◆一组数据中出现次数最多的变量值
◆适合于数据量较多时使用
◆不受极端值的影响
◆一组数据可能没有众数或有几个众数
由上述Mo取值的特点,可得到如下结论:
(1)众数的数值始终偏向相邻组中次数较大的组
(2)当相邻两组的次数相等时,众数则是众数组的组中值。
二、众数、中位数和均值(如:算术平均数)的应用场合
众数一般用来描述分类变量(定性数据),特别是那些有许
多个值的分类变量,例如学历、对事物的态度等。例如,在某一
地区学历的众数是硕士生,对事物的态度的众数是中立。
当一组数据的直方图显示出非对称或非正态分布时,常常使
用中位数是,例如房价和收入数据。
由于均值容易受到极大值或极小值的影响,因此,当数据集
有极端值时,最好不使用均值。如果数据的分布是不对称的,最
好使用中位数(或众数)而不是均值,因为中位数对极端值不敏
感。
总之,如果分布的偏斜程度很高,均值将不能作为一个很好
的度量。相对而言,中位数和众数的代表性更强。
注解:
1.平均指标只能运用于同质总体
平均指标所处理的是同质异量的大量现象,只有在同质总体中,总体各单位才具有共同的特征,从而才能计算它们的平均数来反应现象的一般水平。否则,计算的平均数就会把现象的本质差异掩盖起来不能起到说明事物性质及其规律的作用
2.用组平均数补充说明总体平均数
许多平均指标的计算是在科学分组的基础上进行的,应该重视影响总平均数的各个有关因素的作用,通过计算组平均数对总平均数补充说明来揭示现象内部结构组成的影响,从而克服认识上的片面性。
3.用分配数列补充说明平均数
平均数只是说明现象的共性,即一般水平,而把总体各单位数量标志的差异给抽象化了,掩盖了总体各单位的差异及其分配情况,为了比较深入的说明问题,再利用平均数对社会经济现象进行分析时。还要结合原来的分配数列,分析平均数在原来数列中所处的位置,以及各单位标志值在平均数上下的分配情况。
方差与标准差:离散趋势之常用指标
一、离散趋势指标的概念与作用
1.概念: 离散趋势指标是反映总体各单位标志值差异(离散)程度的指
标。又称标志变异指标、离散程度指标等。
注意:平均指标与离散趋势指标的区别:
平均指标考虑的是如何消除离差,显示集中趋势。因此,它只能反映现象
的集中趋势而不能反映总体各单位标志值的差异程度。
而离散趋势指标考虑的则是如何计算离差,反映离散的程度及离差的大小。
(3)反映社会经济现象的均衡性和稳定性。
• 如甲、乙两工厂某年四个季度的产量资料如下(单位:万件):
• 甲:65、68、72、75,平均每季产量为70万件;
• 乙:34,51,95,100,平均每季产量为70万件。