建模之相关系数

本文详细介绍了Person相关系数和Spearman相关系数的计算与假设检验过程,通过八年级男生体测数据为例,阐述了如何进行相关性分析。在使用Person相关系数前需先判断数据的线性相关性,而Spearman相关系数适用于非正态分布或非线性关系的数据。文章还提到了正态性检验和显著性检验的方法,以及在Matlab和SPSS中的应用。
摘要由CSDN通过智能技术生成

person相关系数及spearman相关系数

以“分析八年级男生体测数据”为例
一.person相关系数
基础知识(概率论与数理统计及matlab):
总体均值( E ( x ) E ( y ) E(x) E(y) E(x)E(y)),总体协方差( C o v ( X , Y ) Cov(X,Y) Cov(X,Y)),总体person相关系数( ρ ( x , y ) \rho(x,y) ρ(x,y)),样本协方差,样本person相关系数。
注意:

  1. 如果两个变量本身就是相关性的关系,那么person相关系数绝对值大的相关性强,小的相关性弱。
  2. 在不确定两个是什么关系的情况下,person相关系数不能说明两个变量之间的相关性
  3. 所以在使用person相关系数之前必须先画出散点图来判断两个变量是否具有相关性。

1 . 首先对数据进行描述性统计:
(1)matlab:

Min=min(test);
 Max=max(test);
Mean=mean(test);
Median=median(test);%中位数
Skewness=skewness(test);%偏度
Kurtosis=kurtosis(test);%峰度
Std=std(test);
result=[Min;Max;Mean;Median;Skewness;Kurtosis;Std]%矩阵的拼接

(2)SPSS
(3)Excel自带的描述统计功能
2 .画出散点图
可以用SPSS或者matlab,此处用SPSS比较方便。在这里插入图片描述
由于数据太多,看着并不直观。但显然大部分数据不具有线性相关性,此处我们假设该数据具有线性相关性。
3 .person相关系数的计算
在matlab中使用corrcoef函数
使用方法:R=corrcoef(A)%矩阵A :R=corrcoef(A,B)%向量A,B
拓展:美化相关系数表(一般的数据表也适用)
(1).不同背景色来强调数值的大小。Excel
在这里插入图片描述
4.检验数据是否是正态分布(对相关系数进行假设检验以判断相关性的前提)
(1)JB检验
适用于大样本n>30
原理:设有某随机变量 X i {Xi} Xi,其偏度为S,峰度为K,构造统计量JB(与S,K有关)。若数据为正态分布,则JB统计量在大样本的情况下符合自由度为2的卡方分布。
步骤:H0:该随机变量服从正态分布。H1:该变量不服从正态分布。
然后计算该组变量偏度和峰度,得到其统计量JB*,并计算其对应的P值,比较P值与0.05(一般情况下置信水平取95%)。P>0.05,无法拒绝原假设,即随机变量符合正态分布;P<0.05,在95%的置信水平下,(发生了小概率事件)可以拒绝原假设。
matlab语法:[h,p]=jbtest(x,alpha)%alpha为显著水平,一般取0.05,x为要检验的随机变量,且x只能是向量。h=1代表可以拒绝原假设,即变量x不是正态分布;h=0代表不能拒绝原假设,即变量x符合正态分布。

n=size(test,2);
hh=ones(1,n);
pp=ones(1,n);
for i=1:n
[hh(1,i),pp(1,i)]=jbtest(test(:,i),0.05);
end
[hh;pp]

(2).Shapiro-wilk检验
适用于小样本 3 < = n <

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奇迹luanluan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值