统计学 第四章 数据的概括性度量

统计学 第四章 数据的概括性度量

一、集中趋势的度量
集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
1.分类数据:众数
(1)概念
众数是一组数据中出现次数最多的变量值,用M。表示。
2.顺序数据:中位数和分位数
中位数是一组数据排列后处于中间位置上的变量值,用Me表示。主要用于测量顺序数据的集中趋势,也适用于测量数值型数据的集中趋势,不适合分类数据。
3.数值型数据:平均数
平均数也称为均值,它是一组数据相加后除以数据的个数得到的结果。平均数在统计学中具有重要的地位,是集中趋势的最主要测量值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。
(1)简单平均数与加权平均数
简单平均数:根据未分组数据计算的平均数,用总体各单位标志值简单相加得到的标志总量除以单位总量而得。
加权平均数:根据分组数据计算的平均数。
几何平均数:n各变量值乘积的n次方根,用G表示。主要用于计算比率的平均。当变量是比率当形式时,采用几何平均法计算平均比率更为合理。
(2)众数、中位数和平均数的特点与应用场景
众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。
众数只有在数据量较多时才有意义,当数据量较少时,不宜适用众数。众数主要适合作为分类数据当集中趋势测量值。
平均数是对数值型数据计算的,而且利用量全部数据信息,它是实际中应用最广泛的集中趋势测量值。
当数据呈现对称分布或接近对称分布时,3个代表值相等或接近相等,这时则应选择平均数作为集中趋势的代表值。但平均值只要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是当偏态程度较大时,可以考虑选择众数或中位数。

二、离散程度的度量
数据离散程度是数据分布的另一个重要特征,它反映的是各变量值远离其中心值的程度。
1.分类数据:异众比率
2.顺序数据:四分位差
上四分位与下四分位之差,用Qd表示。
四分位差反映另中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数据越大,说明中间的数据越分散。
3。数值型数据:极差、平均差、方差和标准差
极差也称全距,用R表示。

相对离散程度:离散系数
离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比,

三、偏态与峰态的度量
集中趋势和离散程度是数据分布的两个重要特征,为全面了解数据分布的特点,还需要知道数据分布的形状是否对称、偏斜的程度以及分布的扁平程度等。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值