常用的数量统计量的计算及统计意义

数量统计量是只适合数量类型数据的统计量,使我们最常见的统计量。笔者之前对资料特征数的计算作了简单地介绍,详情可跳转至 资料特征数的计算,本篇博客力求全面和简洁易懂。

对于数量类型的数据样本 X1,X2,,Xn 其数量统计量定义如下:

  1. 均值(Mean)

    X=1nn1Xi
    很简单,用来描述数据取值的平均位置。

  2. 方差(Sample Variance)

    S2n=1n1(XiX)2
    至于为何分母为 n-1,同样点击传送门:资料特征数的计算

  3. 标准差(Standard Deviation)

    Sn=1n1(XiX)2
    标准差在数值上等于方差的开平方,他们都是用来反应数据取值的离散(变异)程度的。标准差的量纲与数据的量纲相同。

  4. 变异系数(Coefficient of Variation,CV)

    CV=SnX
    标准差与均值的比值成为变异系数。它是一个无量纲的量,用来刻画数据的相对分散性。

  5. 标准误(Standard Error)

    1n1n1(XiX)2n=1n(n1)n1(XiX)2
    标准误是由样本的标准差除以样本个数的开平方计算得到的。标准误代表的就是样本均数对总体均数的相对误差。

  6. 偏度(Skewness)

    skewness=nn1(XiX)3[n1(XiX)2]32
    偏度是用来刻画数据对称性的指标。关于均值对称的数据,其偏度系数为0;若左侧数据比较分散,则偏度系数小于0;若右侧数据比较分散,则偏度系数大于0。

    在图像上的差别为:正态分布的偏度为0,如果 skewness>0 代表波形有右侧长尾(正偏),如果 skewness < 0 代表波形有左侧长尾(反偏)。图像如下(左图为反偏,右图为正偏):
    这里写图片描述

    在 MATLAB 中对应的函数即为 skewness().

  7. 峰度(Kurtosis)

    kurtosis=nn1(XiX)4[n1(XiX)2]23
    峰度可以描述样本数据分布形态相对于正态分布的陡峭程度。

    • 若 Kurtosis=0,则与正态分布的陡峭程度相同;
    • 若 Kurtosis>0,则比正态分布的高峰更加陡峭,表现为尖顶峰;
    • 若 Kurtosis<0,则比正态分布的高峰显得平缓,表现为平顶峰。

    在 MATLAB 中对应的函数即为 kurtosis().

    偏度与峰度可以用来描述样本数据分布形状,如果是正态分布,那么偏度为0,峰度也为0.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值