7.相关性分析

文章介绍了皮尔逊相关系数的适用场景,强调它用于描述线性关系,并提供了Excel和SPSS的数据分析技巧,包括快捷操作和假设检验步骤。同时提到了数据正态性检验的重要性,如正态分布的JB检验和夏皮洛-威尔克检验。
摘要由CSDN通过智能技术生成

皮尔逊相关系数的计算以及数据的描述性统计

关于皮尔逊相关系数的一些理解误区

注:皮尔逊只能描述线性关系

所以先画散点图大致看一下点的走向,是不是线性关系,再用皮耳孙相关系数

相关系数大小解释
一些excel的快捷操作

ctrl+➡快速跳转到最后一列

ctrl+shift+➡选中此行

ctrl+shift+➡+⬇全选(左上角)

例题:八年级女生体测数据

或者使用excel中的数据分析 5-1 35min处或者参考ppt

利用matlab将一些基本量求出来,得到此数据的描述性统计(很重要,可以写到论文里)

用SPSS分析数据:

标度:数值型,如身高体重

有序:如,甲乙丙丁

名义:没有顺序,如性别

导入数据怎么分析?

分析--

移动变量的快捷方法:ctrl+A 全选

然后选择想分析的,点确定就会有一个计算好的表格了

分析两个数据之间的线性关系?

选 图形---旧对话框---散点图/点图---矩形---定义---选择矩阵变量---确定

美化相关系数表格

调正单元格大小:

条件格式---管理规则---编辑规则

改成这样也可

假设检验

step1:确定原假设和备择假设

step2:构造分布 正态,t分布,F分布,X方分布

step3:画概率密度图

step4:给出置信水平

同概率论

皮尔逊相关系数进行假设检验

tpdf是matlab中的一个函数,28是服从自由度为28的分布

https://wenku.baidu.com/view/d94dbd116bd97f192279e94a.html

t分布表

计算各列之间的相关系数以及p值

*** 99%显著 P<0.01 在99%水平上拒绝原假设(说明对原假设很保护呗,也侧面说明这个数据偏离μ有点大

** 95%显著 0.01<P<0.05

* 90%显著 0.05<P<0.1

你想证明一班的成绩比二班好:

那么原假设H0 就设为一班二班成绩相同,其中出现的个别成绩有差异,是由于抽样误差所造成的,纯在偶然性,差异数据不具备统计学意义,可以忽略该差异的影响

备择假设H1就设为一班比二班成绩好,其中样本中出现的一班二班成绩差异不是偶然出现的,具有高度统计学意义,不可忽悠该差异的影响

P:在定义了H0的情况下,代表了由于偶然误差导致的H0不成立的碰巧可能性大小。

P小,拒绝H0的出错的概率就小,所以不能接受H0

P大,拒绝H0的出错的概率就大,所以要接受H0

因此, 当把显著性水平设定为0.05时,

当P值小于0.05时, 我们认为因为偶然性而造成的成绩差异的概率比较小,该差异具备统计学意义,该差异不是由于偶然性的抽样导致的,而是两组数据之间的差异存在着显著意义,因此无法忽略该差异,不能接受H0.

因此拒绝原假设,就可以接受一班成绩比二班好的事实;

2. 若P值比0.05大,就原假设中因为抽样误差而造成的成绩差异的可能性比较高,说明没有足够证据证明一班成绩比二班好,保守起见拒绝备择假设 接受原假设

(转自知乎)

SPSS操作

分析---相关---双变量

选择双变量

双尾是双侧检验的意思

皮尔逊相关系数假设检验条件

(检验是不是正态分布)

正态分布JB检验

要求数据量大于30

[h,p]=jbtest(Test(:,1),0.05)

核心代码,h只有两个值,0和1 ,1表示服从正态分布 ;p是显著性水平

夏皮洛-威尔克检验

小样本分析

利用SPSS分析

分析---描述统计---探索

点击 图

勾选含检验的正态图

看最后一列,都是0,落入拒绝域内,所以拒绝原假设(就不是正态分布)

QQ图

要求数据量非常大,只需要看点是否在一条直线上

在一条直线上说明是正态分布

斯皮尔曼相关系数

注意:4.5就是 (4+5)/2

rs小于0 负相关

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值