数理统计——频数和相关系数

首先上图
这里写图片描述
两边一样,叫对称分布(正态分布)
右边的数据比左边的数据离散,叫右偏分布(正偏态)
左边的数据比右边的数据离散,叫左偏分布(负偏态)
偏态分布有两个特点:
它有两个特点:
一是左右不对称(即所谓偏态);
二是当样本增大时,其均数趋向正态分布。

skewness偏度:对于右偏分布,偏度为负;对于左偏分布,偏度为正。对称分布,偏度为0
Kurtosis峰值:是对Sample构成的分布的峰值是否突兀或是平坦的描述。计算时间序列x的峰度,峰度用于度量x偏离某分布的情况,正态分布的峰度为3。当时间序列的曲线峰值比正态分布的高时,峰度大于3;当比正态分布的低时,峰度小于3。

“统计上是用四阶中心矩来测定峰度的。因为实验研究表明,偶阶中心矩的大小与图形分布的峰度有关。其中的二阶中心矩就是数据的方差,它在一定程度上可以反映分布的峰度,但有时方差相同的数据却有不同的峰度,因此就利用四阶中心矩来反映分布的尖峭程度。为了消除变量值水平和计量单位不同的影响,实际工作中是利用四阶中心矩与σ4的比值作为衡量峰度的指标,称为峰度系数。但是在SPSS中的计算公式是四阶中心矩与σ4的比值减去3后的值,这个值与0相比,如果为0,说明其峰度与正态分布相同。大于0,说明它是比正态分布要陡峭。”——百度百科

相关系数
皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数。皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。这里写图片描述
两变项间的相关可以用许多统计值来测量,最常用的是皮尔森相关系数。
spearman相关系数:对不服从正态分布的资料、原始资料等级资料、一侧开口资料、总体分布类型未知的资料不符合使用积矩相关系数来描述关联性。此时可采用秩相关(rank correlation),也称等级相关,来描述两个变量之间的关联程度与方向。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值