数据学习(二)-数据的概括分析

数据的概括性度量

  • 1.集中趋势的度量

    2.离散程度的度量

    3.偏态与峰态的度量

    4.小知识模块

1.集中趋势的度量

集中趋势是指一组数据向某一中心值靠拢的倾向,它反应了一组数据中心点的位置所在。集中趋势度量也就是寻找数据水平的代表值或中心值。
1.1 分类数据:纵数
一组数据中出现次数最多的变量值。它主要用于测量分类数据、顺序数据和数值型数据的集中趋势。一般情况下,只有数据较大时,纵数才有意义。

在这里插入图片描述
1.2 顺序数据:中位数和分位数
一组数据排序后处在中间的变量值为中位数。分为两部分,吗,每部分包含50%,一部分比中位数大,一部分比中位数小。一组数据在25%和75%的位置,那么我们称为分位数。
中位数计算公式如下:
location=(n+1)/2
在这里插入图片描述
分位数介绍如下:
在这里插入图片描述
1.3 数值型数据:平均数
一组数据相加除以数的个数为平均数。计算公式如下:
在这里插入图片描述
各个变量值倒数的平均倒数,称为调和平均数。调和平均数其实本质和平均数的求法是一样的,只是换了一种计算方法。

几何平均数:n个变量值乘积的n次方根。计算公式如下:
在这里插入图片描述

2. 离散程度的度量

集中趋势只是数据分布的一个特征,他所反应的是各变量值向其中心值聚集的程度。数据的分布程度是数据分布的另一个重要特征,它所反映的是各变量值远离其中心值得程度,因此也叫离散趋势。描述数据离散程度采用的测度值,根据所依赖数据的的不同主要有异众比率,四分位差、方差和标准差。

2.1 分类数据:异众比率
非众数组的频数占总频数的比率。异纵比率主要用于衡量纵数对一组数据的代表程度。比率值越大,说明非纵数的频数占总频数的比率越大,说明纵数的代表性越差,否则反之。计算公式如下:
在这里插入图片描述
2.2 顺序数据:四分位差
上四分位与下四分位的差称为四分位差。计算公式如下:
在这里插入图片描述
2.3 数值型数据:方差和标准差
1.极差
在这里插入图片描述
计算公式如下:
在这里插入图片描述
2. 平均差
在这里插入图片描述
计算公式如下:
在这里插入图片描述
3.方差和标准差
平均差在数学处理上是通过绝对值消去离查的正负号,如果用平方的办法消去离差的正负号,便宜数学上的处理,这样的计算方法叫方差。方差是是几中应用最为广泛地离散程度测度值。
在这里插入图片描述
公式如下:
在这里插入图片描述
方差的平方根称为标准差。公式如下:
在这里插入图片描述
2.4 相对位置的度量:标准分数
在这里插入图片描述
计算公式如下:
在这里插入图片描述
2.5 相对离散程度:离散系数
一组数据的标准差与其相应的平均数之比,称为离散系数,也称为变异系数。
离散系数是测度数据离散程度的相对统计量。计算公式如下:
在这里插入图片描述

3 偏态与峰态的度量

3.1 偏态及其测度

数据分布的不对称性,称为偏态。对数据分布不对称性的度量值,称为偏态系数。计算公式如下:
在这里插入图片描述
式中s3是标准方差的三次方。

3.2 峰态及其测度

数据分布的顶峰或尖峰程度,称为峰态。对数据分布峰态的度量值,称为峰态系数。计算公式如下:
在这里插入图片描述

**

4. 小知识模块

**
后面再补充

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值