贾俊平-第四章:数据的概括性度量

贾俊平-第四章:数据的概括性度量

4.1 集中趋势的度量
集中趋势&离散趋势:
集中趋势:低层次数据的集中趋势测度值适用于高层次的测量数据;但反之并不适用。

4.1.1 分类数据:众数M0
只有在数据量较大的情况下众数才有意义;众数可以有多个。
4.1.2 顺序数据:中位数Me和分位数
中位数:不适用于分类数据
4.1.3 数值型数据:平均数
①简单平均数与加权平均数
②调和平均数Hn(平均数的另一种表现形式)
③几何平均数Gm
4.1.4 众数、中位数和平均数的比较

4.2 离散程度度量
数据离散程度越大,集中趋势的测度值对该组数据的代表性就越差;反之则越好。

4.2.1 分类数据:异众比率
4.2.2 顺序数据:四分位差
4.2.3 数值型数据:方差和标准差
1.极差(易受极值影响,且不能反映中间数据的分散情况)
2.平均差
3.方差和标准差
4.2.4 相对位置的度量:标准分数
1.标准分数
2.经验法则
当一组数据对称分布时:
约有68%的数据在平均数加减1个标准差的范围之内;
约有95%的数据在平均数加减2个标准差的范围之内;
约有99%的数据在平均数加减3个标准差的范围之内;
在3个标准差之外的数据,在统计上也称为异常值或离群点。
3.切比雪夫不等式
对于任意分布形态的数据,至少有(1-1/k2)的数据落在k各标准差之内;其中k时大于1的任意值,但不一定是整数。
eg:当k=2,指至少有75%的数据落在平均数加减2各标准差的范围之内。
4.2.5 相对离散程度:离散系数

4.3 偏态与峰态的度量
集中/离散是数据分布的特征,偏态/峰态是数据分布的特点
4.3.1 偏态即其测度
当SK=0,则分布对称(变量与平均数三次方后,累加时会相互抵消);
当SK>0,正偏/右偏;
当SK<0,负偏/左偏。
SK值越大,偏斜程度越大。
4.3.2 峰态及其测度
K=0 ——正态分布
K>0 ——尖峰分布
K<0 ——扁平分布

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值