学习笔记|线性相关分析|绘制散点图|计算r系数|双变量线性相关性分析|规范表达|《小白爱上SPSS》课程:SPSS第十八讲:如何进行线性相关分析?

学习目的

SPSS第十八讲:如何进行线性相关分析?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

线性相关分析

0 引言

在统计学中,事物或现象之间的关系是通过变量间的关系反映出来的。变量间的关系分为确定性关系和非确定性关系两类。确定性关系即函数关系。然而在实际问题中,随机变量之间虽有某种关系,但这种关系却难以用精确的表示方法来描述(不像数学函数),那么这种非确定性关系即相关关系。
在科研中,经常需要分析两种现象或事物之间的关系,例如,百米跑成绩与跳远成绩间有无关系?如果有,其关系如何?百米跑成绩提高0.01s,跳远成绩将会受到何种影响?对于这类变量间关系的研究就属于相关与回归问题。
我们今天要学习的线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
分析两个变量之间有无关系我们常用两种方法:

1. 绘制散点图

考察相关性最简单而直观的方法就是在XOY直角坐标系上画出散点图,通过散点图可以看出两个变量间是否存在线性关系。通过散点图,我们可以绘制如下四种相关图形。
在这里插入图片描述
但是散点图只能大致描述两个变量之间是否存在关系,而不能够准确度量两个变量关系密切程度,因此我们我们会用数学上的方法去计算准确的相关关系。

2.计算r系数

对于两个连续型变量来说,描述两个变量之间直线关系的密切程度和相关方向的统计指标叫做相关系数,统计上也称为Pearson积矩相关系数。
样本线性相关系数一般用r表示、总体相关系数一般用p表示。相关系数没有单位,其取值范围为|r|≤1。
计算公式如下(不明白公式,可以感受一下,然后略过):
在这里插入图片描述
① 符号:如果为正号,则表示正相关,如果为负号,则表示负相关。
② 取值为0,这是极端,表示不相关。取值为1,表示完全正相关,取值为-1,表示完全负相关
③ 若变量间的直线关系越密切,则|r|越接近于1;当变量之间的直线关系越不密切,|r|越接近0
④ 根据样本资料计算出的相关系数r是一个样本计算量,存在抽样误差。因此必须对r进行显著性检验,以判断其是否来自总体相关系数p=0的一个样本。
所以相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。

一、实战案例

小白测得12名女大侠的体重和肺活量数据,如下表。问:体重和肺活量之间有无关系?
读数据:

GET 
  FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第十八讲:线性相关分析.sav'. 

在这里插入图片描述

二、统计策略

统计分析策略口诀“目的引导设计,变量确定方法”。
针对上述案例,扪心七问。
Q1:本案例研究目的是什么?
A:关联分析。
Q2:分析的组数是多少呢?
A:两组数据。
Q3:本案例属于什么研究设计?
A:调查研究
Q4:有几个变量?
A:有两个变量。体重与肺活量。
Q5:变量类型是什么?
A:体重和肺活量都属于连续型变量。
Q6:组内两变量数据服从正态分布么?
A:需要检验。若服从,可以进一步检验双变量关系是否为线性关系;若不服从正态,采用秩相关分析。
Q7:组内双变量关系是否为线性关系?
A:需要检验。
概括而言,如果数据满足以下条件,则采用线性相关分析。
在这里插入图片描述

统计分析步骤:

第一,考察直线的可能性
第二,计算r值
第三,用样本推算总体,运用t检验。
第四,直线性关系的有无及大小

三、SPSS操作

1、正态性检验

本案例需要对体重和肺活量都进行正态性检验。
在这里插入图片描述
经S-W(夏皮洛-威尔克)检验,体重、肺活量数据的p值分别为0.490和0.465,均大于0.05,无统计学意义,支持原假设,可认为两组数据符合正态分布。

2、绘制散点图

操作方式:依次点击“图形——旧对话框——散点图/点图——简单散点图”。
在这里插入图片描述
命令行:

GRAPH 
  /SCATTERPLOT(BIVAR)=体重 WITH 肺活量 
  /MISSING=LISTWISE.

在这里插入图片描述
初步分析:两变量间存在线性相关趋势,没有发现明显的异常值。

3、正式分析

Step1:操作方式:“分析——相关——双变量”
Step2:将【体重】【肺活量】放入【变量】窗口,同时选择【皮尔逊】相关系数。
在这里插入图片描述
命令行:

CORRELATIONS 
  /VARIABLES=体重 肺活量 
  /PRINT=TWOTAIL NOSIG  /*显著性检验:双尾*/
  /MISSING=PAIRWISE	 /*皮尔逊*/.

四、结果解读

在这里插入图片描述
可以看到,Pearson相关分析结果显示,r=0.828, p=0.01, 具有统计学意义,不接受原假设:数据无相关性有误,表示体重和肺活量存在正相关。

五、规范表达

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范图表

(1)如果只有两个变量之间相关,建议采用散点图呈现结果更直观。
在这里插入图片描述
(2)如果是多个变量之间关系,则可采用类似相关矩阵来描述。
在这里插入图片描述

2、规范文字

Person相关分析结果显示,体重与肺活量的相关系数r=0.828,p=0.001,表明体重与肺活量之间存在正相关。
小白学习完了线性相关分析课程,向主任汇报了自己分析成果。
主任看后说:“小白,如果不服从正态分布,你可知怎么办吗?”
小白说:“…”
主任说:“那你还是好好学习,天天向上吧!”
小白查查了下一讲内容:秩相关分析。

六、划重点

1、随机变量之间难以用精确的表示方法来描述(不像数学函数)的非确定性关系即相关关系。
2、线性相关分析就是对两个变量之间有无和关系大小做出统计推断的方法。
3、分析两个变量之间有无关系我们常用两种方法:绘制散点图和计算r系数。
4、线性相关分析要求两个连续型变量均服从正态性分布,若不服从正态分布,则采用秩相关。
5、相关系数r是表示两个随机变量之间呈直线相关的强度和方向的统计量。
6、计算完r后要检验r是否具有统计学意义。

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

打酱油的工程师

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值