[统计学笔记] (四)数据分布的数字特征

本文介绍了数据分布的数字特征,包括集中趋势和离散程度的测定。集中趋势通过算术平均数、众数和中位数等指标衡量,而离散程度则涉及异众比率、极差、四分位差、平均差、方差和标准差。文章还探讨了这些统计量在不同类型数据(如定性、定量)中的适用性和特点,以及如何利用它们来评估数据的分布形态和稳定性。
摘要由CSDN通过智能技术生成

(四)数据分布的数字特征

数据的分布特征与使用的描述统计量


数据集中趋势

在统计研究中,需要搜集大量数据并对其进行加工整理,大多数情况下数据都会呈现出一种钟形分布,即各个变量值与中间位置的距离越近,出现的次数越多;与中间位置距离越远,出现的次数越少,从而形成了一种以中间值为中心的集中趋势。这个集中趋势是现象共性的特征,也是现象规律性的数量表现。

根据统计学知识,集中趋势指平均数,是一组数据中有代表性的值,这些数值趋向于落在数值大小排列的数据中心,被称为中心趋势度量。最常用的中心趋势度量有算术平均数、几何平均数、调和平均数、众数和中位数。

均值是一组数据的算术平均,它利用了全部数据信息,是概括一组数据最常用的一个值。

众数是一组数据中出现次数最多的变量值,它用于对分类数据的概括性度量,其特点是不受极端值的影响,但它没有利用全部数据信息,而且还具有不唯一性。一组数据可能有众数,也可能没有众数;可能有一个众数,也可能有多个众数。

中位数是一组数据按大小顺序排序后处于中间位置上的变量,它主要用于对顺序数据的概括性度量。

对于总体中的个体数据,有时会呈现出在一定范围内以某个数据为中心上下波动的分布特征,即数据有时具有它分布的中心,我们称之为数据分布的集中趋势。


集中趋势指标的分类

 

集中趋势指标的作用

可以反映一组数据分布的中心或一般水平;

可以反映同一现象在不同时间或空间条件下的发展趋势或差异;

以用来分析现象之间的依存关系;

样本平均数是统计推断的一个重要统计量。


集中趋势的测定

数值平均数

数值平均数只适用于定量数据(数值型数据),而不适用于定性数据。

1、算术平均数

(1)简单算术平均数

   简单算术平均数是根据未分组数据(原始数据)计算的一种平均数,它是将所有的原始数据相加再除以数据总个数得到的。

  • 样本计算的简单算术平均数的计算公式是:

\large \overline{X} = \frac{\sum_{i=1}^{n}X_{i}}{n}

  • 总体数据计算的简单算术平均数的计算公式为:

\large \mu = \frac{\sum_{i=1}^{N}X_{i}}{N}

 

2、加权算术平均数

  • 加权算术平均数是根据分组数据计算的一种平均数。设样本被分为k组,各组的频数为fi样本计算的加权算术平均数的计算公式为:

 

其中,Xi有两种情况:在单变量值分组中,Xi代表各组的变量值;在组距式分组中,Xi代表各组的组中值,    称作权重(频率)。

 

  • 总体数据计算的加权算术平均数 的计算公式为:

(3)算术平均数的主要数学性质

①各变量值与其算术平均数的离差之和等于零;

   即:

 

②各变量值与其算术平均数的离差平方和最小。

即:

 

 

3. 调和平均数

调和平均数加权算术平均数的一种变形。   

调和平均数与加权算术平均数的关系是:若已知各组变量值  及其标志总量mi(mi=xifi ),而缺乏fi的数据时,则加权算术平均数可通过变形得到fi(fi=mi/xi)后,再以mi为权数的调和平均数形式来计算。

 

4. 几何平均数

几何平均数是 n个变量值连乘积的n次方根

(1)简单几何平均数

     当样本数据中各变量值出现的次数都相同时,用简单几何平均数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值