清风数学建模---第五讲相关系数(person相关系数)

person相关系数和spearman等级相关系数。
可以用来衡量两个变量之间的相关性的大小,根据数据满足的不同条件,我们要选择不同的相关系数进行计算和分析

皮尔逊相关系数

先来看两个概念

总体----所要考察对象的全部个体叫做总体。我们总是希望得到总体数据的一些特征(例如均值方差等)
样本-----从总体中所抽取的一部分个体叫做总体的一个样本
计算这些抽取的样本的统计量来估计总体的统计量
比如使用样本均值、样本标差来估计总体的均值(平均水平)和总体的标准差(偏离程度)

总体的person相关系数

在这里插入图片描述
注意:协方差的大小和两个变量的量纲有关,因此在受到量纲的影响时不适合做比较。
在这里插入图片描述
因为X,Y的标准差的单位和X,Y一样,则用总体协方差除以X,Y的标准差就可以消除量纲的影响。
则皮尔逊系数也可以看成是剔除了两个变量量纲影响,即将X和Y标准化后的协方差

样本person系数

在这里插入图片描述
这里应该注意:样本的方差分母为n-1

散点图判断x和y之间的关系

在这里插入图片描述
由图可以看出,当相关系数的绝对值越接近1,就越接近于直线。

关于皮尔逊相关系数的一些误区

皮尔逊相关系数只是用来衡量两个变量新型相关程度的指标;也就是说,你必须先确认
这两个变量是线性相关的,然后这个相关系数才能告诉你他俩相关程度如何。

在这里插入图片描述在这里插入图片描述
则如上图可以发现
1.非线性相关也会导致线性相关系数很大,列如图1中的第二个图。
2.离群点对相关系数的影响很大。例如图1中的图3.且去掉离群点后,相关系数为0.98。
3.如果两个变量的相关系数很大也不能说明两者相关。列如图1中的图4.
4.相关系数计算结果为0,只能说明不是线性相关,但说不定会有更复杂的相关关系(非线性相关)。列入图2.

总结

  • 如果两个变量本身就是线性的关系,那么皮尔逊相关系数绝对值大就是相关行强,小就是相关性弱。
  • 在不确定两个变量是什么关系的情况下就算算出皮尔逊相关系数,发现很大,也不能说明那两个变量线性相关。甚至不能说他们相关,我们一定要画出散点图来看才行。

例题

在这里插入图片描述
首先要注意应该进行描述性统计
在这里插入图片描述
除了用Matlab来进行描述性统计,还可以用Excel或者spss来进行。
Excel:需要在开始->选项->加载项->数据分析中打开数据分析。
SPSS:在这里插入图片描述

皮尔逊相关系数的计算

别忘了应该先判断指标间是否为线性关系

画散点图

因为这里的指标较多,因此选用SPSS来做散点图。
在这里插入图片描述

corrcoef函数

R=corrcoef(A)
返回A的相关系数的矩阵,其中A的列表表示随机变量(指标),行表示观测值(样本)。
R=corrcoef(A,B)
返回两个随机变量A,B之间的系数。

而这里我们要计算的六个指标的相关系数,只需使用R=corrcoef(A);
在这里插入图片描述
数据可以用Excel进行美化,过程如下。
在这里插入图片描述

  • 2
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值