描述性统计量

在R语言和excel中实现描述性统计量

1.1 算术平均(arithmetic mean)

Excel:=average()
R: mean()
Note: 注意区分平均数和期望,算术平均是根据有限样本计算而来(一般认为每个样本权重相同,也可以计算加权平均);期望是理论情况,由样本值乘以对应的概率加和而来;样本无限大时,平均数趋近于期望。

1.2 几何平均(geometric mean)

Excel:=geomean()
R: geometric.mean() (psych​包)
Note: 几何平均数是n个变量值连乘积的n次方根。它是对数水平上的算术平均数。在金融中用的较多, 它仅适用于具有等比或近似等比关系的数据。

1.3 调和平均(harmonic mean)

Excel: =harmean()
R: harmonic.mean() (psych​包)
Note: 调和平均数是一组数的倒数的算术平均数的倒数。常用来计算平均速率/并联电阻,应用较少。

1.4 中位数(median)

Excel: =median()
R: median()
Note: 当数据存在极端值时,用中位数比平均值更好。如有报道称北京的平均年薪是100w,妥妥的没有意义,工资中位值更有意义。

1.5 众数(mode)

Excel: =mode() (有多个众数,只返回首先出现的那个)
R: names(which.max(table(x))) (x为向量)
Note: 主要用于分类数据,数据存在极端值,又有某些值重复出现时,可观察众数。对于离散型或连续性概率密度函数,曲线最高的一处或者几处对应的值就是众数。

1.6 极差(range)

Excel: =max(x) – min(x) (x为一组数)
R: range(x)[2] – range(x)[1] (x为向量)
Note: 一组数最大值与最小值之差。最简单的衡量数据波动情况的指标。

1.7 分位数(quantile)

Excel: =percentile(x, quart) (x为一组数,quart可以为区间[0, 1]的任意数,使用插入值法来确定quart百分位对应的值)
R: quantile(x, quart, type = 2) (x为一组数,quart可以为区间[0, 1]的任意数,使用标准定义来确定如果 k 不是 1/(n-1) 的倍数,函数 PERCENTILE 使用插值法来确定第 k 个百分点的值)
Note: 第p个百分位定义如下:1,如果np/100不是整数,而k是小于np/100的最大整数,则第k+1个最大样本点即是第p个百分位数;2,如果np/100是整数,则第np/100与np/100+1两个观察值的算术平均定义为第p个百分位数。通常使用的百分位数:四分位数(25, 50, 75),五分位数(20, 40, 60, 80) ,百分位数(10, 20,…, 90),百分位数。

1.8 方差(variance)

Excel: =var()
R: var()
Note: 用来描述一个随机变量的离散程度,表示一个随机变量离期望值的距离。公式为s^2 = ∑(x – E(x))^2 / (n-1),这里x为随机变量,E(x)为期望,n为样本个数,注意分母为n-1,而不是n。

1.9 标准差(SD)

Excel: =stdev()
R: sd()
Note: 标准差是方差的平方根。对于正态分布,有68-95-99.7法则,即落在一个标准差内的数据占68%,以此类推。

1.10 变异系数(CV)

Excel: = stdev(x) / average(x) (x为一组数)
R: sd(x) / mean(x) (x为数值型向量)
Note: 标准差与平均值之比。也被称为标准离差率,无量纲,用来衡量数据的波动情况,伯纳德-罗斯钠建议cutoff为0.5,如果CV大于0.5,则波动较大。

1.11 峰度(kurtosis)

Excel: =kurt()
R: kurtosis() (moments 包)
Note: 峰度用来描述样本概率密度曲线陡缓程度的曲线,通常与正态分布比较(正态分布的峰度为3,用excel计算时,结果已经减了3,而用R包计算时未减3),峰度大于0表示为尖顶峰,小于0表示平顶峰。峰度的绝对值越大表示与正态分布差别越大。

1.12 偏态 (skewness)

Excel: =skew()
R: skewness() (moments 包)
Note: 描述总体取值分布的对称性。偏度为0表示样本偏斜程度与正态分布一样;偏度小于0,则在左侧有一条长长的尾,为负偏态;偏度大于0,则在右侧有一条长长的尾,为正偏态。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值