详解集中量数(各类平均数:平均数、几何平均数、调和平均数)

本章节主要讲解一些常见的集中量数计算方法、意义及特点,计算方法,同时会给出R语言计算代码,向大家分享。

使用的教材是:

张厚粲《现代心理与教育统计学》第四版,对应着的是第三章

题主也是一个门外汉,去年下半年才开始接触R语言和统计学,如果内容存在问题(公式错误、表述错误、计算错误等),尽请提出,同时也欢迎大家讨论统计相关话题,谢谢~

0. 集中趋势VS离中趋势

  • 集中趋势(central tendency)与离中趋势是次数分布的两个基本特征。

  • 数据的集中趋势就是指数据分布中大量数据向某方向集中的程度;离中趋势是指数据分布中数据彼此分散的程度。

  • 这两种量数一起共同描述或反映-组数据的全貌及其各种统计特征。

用于描述数据集中程度的统计量,即集中量数(measures ofcentral tendency)有多种,包括算术平均数、中数、众数、加权平均数、几何平均数、调和平均数等。

本章节主要介绍集中量数的性质、意义、计算工具以及应用。

1.1 算数平均数的意义

算术平均数(arithmetic average),一般简称为平均数(average)或均数均值(mean),论文中一般用“M”表示。

算术平均数只有在与其他几种平均数,如几何平均数、调和平均数、加权平均数相区别的时候,才把它叫做算术平均数。如果平均数是由X变量计算的,就记为

公式为:

平均数的概念比较好理解,因此就不赘述计算方法了,可以通过R语言的mean函数进行运算:

下面就介绍一下平均数的优缺点:

1.2 算术平均数的优缺点

优点

  • 1.反应灵敏。观测数据中任何一个数值或大或小的变化,甚至细微的变化,在计算平均数时,都能反映出来。

  • 2.计算严密。计算平均数有确定的公式,不管何人在何种场合,只要是同一组观测数据,计算的平均数都相同。

  • 3.计算简单。计算过程只是应用简单的四则运算。

  • 4.简明易解。平均数概念简单明了,较少数学抽象容易理解

  • 5.适合于进一步用代数方法演算。在求解其他统计特征值,如离均差、方差、标准差的计算时,都要应用平均数。

  • 6.较少受抽样变动的影响。观测样本的大小或个体的变化,对计算平均数影响很小。在来自同一总体逐个样本的集中量数中,平均数的波动通常小于其他量数的波动,因此它总是最可靠、最正确的量数。

缺点

1.易受极端数据的影响。由于平均数反应灵敏,因此当数据分布呈偏态(与“正态分布”相对,分布曲线左右不对称的数据次数分布)时,受极值(extreme value/score)的影响,平均数就不能恰当地描述分布的真实情况。在心理与教育方面的实验观测中,偶然因素十分复杂,经常会出现极端数目。

出现这类问题时,也可以使用修剪平均数来解决。修剪平均数(trimmed mean)也称截尾平均数,是从一组数据中去除一定百分比(如5%) 的最大值和最小值数据后,再次计算的算术平均值。

当希望在分析中剔除一部分数据计算平均数时,可以使用这种平均数。

在计算平均数时除去极端值,对数据集中趋势的估计效果会更好,特别是数据不属于正态分布(比如说偏态分布) ,这种方法更妥当。

在实际生活中,大家常常会看到各种知识竞赛或评比中,在计算某一选手的平均分时,经常会把多个评委评分中的最高分和最低分去掉,再算平均值,这种做法更科学。

2.

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值