[线性相关] 皮尔森相关系数的计算及假设检验

皮尔森相关系数,又称积差相关系数、积矩相关系数,可以看做将两组数据首先做Z分数处理之后, 然后两组数据的乘积和除以样本数Z分数一般代表正态分布中, 数据偏离中心点的距离.等于变量减掉平均数再除以标准差。按照大学的线性数学水平来理解, 它比较复杂一点,可以看做是两组数据的向量夹角的余弦。


从以上解释,也可以理解皮尔逊相关的约束条件:

1、两个变量间有线性关系

2、变量是连续变量

3、两个变量的总体均符合正态分布:取大样本进行正态分布非参数检验

4、两变量独立


在实践统计中,一般只输出两个系数,一个是相关系数,也就是计算出来的相关系数大小,在-1到1之间;另一个是独立样本检验系数,用来检验样本一致性。

 

现举例说明计算相关系数的一般步骤:

  例9.1 测定15名健康成人血液的一般凝血酶浓度(单位/毫升)及血液的凝固时间(秒),测定结果记录于表9.1第(2)、(3)栏,问血凝时间与凝血酶浓度间有无相关?

  1.绘图,将表9.1第(2)、(3)栏各对数据绘成散点图。

  2.求出∑X、∑Y、∑X2、∑Y2、∑XY,见表9.1下方。

  3,代入公式,求出r值。


表9.1 相关系数计算表

受试者号
(1)

凝血酶浓度(单位/毫升)X
(2)

凝血时间(秒)Y
(3)

1

1.1

14

2

1.2

13

3

1.0

15

4

0.9

15

5

1.2

13

6

1.1

14

7

0.9

16

8

0.9

15

9

1.0

14

10

0.9

16

11

1.1

15

12

0.9

16

13

1.1

14

14

1.0

15

15

0.8

17

合计

15.1

222

                                                                                                                                       

                                                                                                                                        ∑X=15.1 ∑Y=222

∑XY=221.7 
 ∑X2=15.41∑Y2=3304    

  本例的相关系数r=-0.9070,负值表示血凝时间随凝血酶浓度的增高而缩短;绝对值∣-0.9070∣表示这一关系的密切程度。至于此相关系数是否显著,则要经过下面的分析。

  (二)相关系数的假设检验

  虽然样本相关系数r可作为总体相关系数ρ的估计值,但从相关系数ρ=0的总体中抽出的样本,计算其相关系数r,因为有抽样误差,故不一定是0,要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体,必须进行显著性检验。检验假设是ρ=0,r与0的差别是否显著要按该样本来自ρ=0的总体概率而定。如果从相关系数ρ=0的总体中取得某r值的概率P>0.05,我们就接受假设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系;如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自ρ≠0的另一个总体,因此就判断两变量间有显著关系。

  由于来自ρ-0的总体的所有样本相关系数呈对称分布,故r的显著性可用t检验来进行。本例r=-0.9070,进行t检验的步骤为:

  1.建立检验假设,H0:ρ=0,H1:ρ≠0,α=0.01

  2.计算相关系数的r的t值:

  (9.3)

  3.查t值表作结论

  ν=n-2=15-2=13

  根据专业知识知道凝血酶浓度与凝血时间之间不会呈正相关,故宜用单侧界限,查t值表得

  t0.01,13=2.650

  今∣tr∣>t0.01,13,P<0.01,在α=0.01水准上拒绝H0,接受H1,故可认为凝血时间的长短与血液中酶浓度有负相关。

  为简化tr检验的计算过程,数理统计工作者根据t分配表,已把不同自由度时r的临界值求出,并列成相关系数界值表(见附表11)。故求相关系数后,只需查表就可知道该r值是否显著,而不必再计算tr值。

  r的显著性界限为

  |r|<r0.05, P>0.05 相关不显著

        r0.05≤|r|<r0.01,0.05≥P>0.01 在α=0.05水准上相关显著

  |r|≥r0.01,P≤0.01 在α=0.01水准上相关显著

  例9.1的ν =15-2=13,查附表11中P(1)的界值,得:

  r0.05,13=0.441     r0.01,13=0.592

  现r=-0.9070,∣r∣>r0.01,13,P<0.01,按α=0.01水准,拒绝HO,接受H1。认为ρ≠0,说明凝血时间的长短与血液中凝血酶浓度有负相关。结论与计算所得一致。

  相关系数的显著性与自由度的大小有关,如n=3,ν=1时,虽r=-0.9070,却为不显著;若ν=400时,即使r=0.1000,亦为显著。因此不能只看r的值,不考虑ν就下结论。


  • 9
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值