spearman相关性分析_数据的相关分析及SPSS算例

027af038ba35db10ef814fa661d2f85c.png

之前写过一个用excel做的相关系数文章《用Excel做数据间的相关系数》(点击查看),可以再次温习。

那么今天主要讲一下用SPSS做相关分析。

Excel的数据分析能力比SPSS还是稍微弱一点的,毕竟SPSS也是主要分析数据的一个软件,那么在相关分析的这里就凸显了它的强大之处,您再次读这篇文章《用Excel做数据间的相关系数》,会发现,Excel中的相关系数的分析只是皮尔逊(Pearson)相关分析。而SPSS中包括了三种相关分析(Pearson/ Kendall’s tau-b / Spearman)。

bf32dd6bc7936784bfb0a9e2adbbdca6.png

世间万物除了因果关系、共变关系还有相关关系。相关关系中分为正相关、负相关和不相关,体现在数字上就是[-1,1]。若想形象的表示两种数据之间的关系,可以制作一个相关关系散点图。相关还有偏相关,偏相关是指将其他变量影响予以排除,求两个变量之间的关系。这些用SPSS软件都能做到。

3c493c9ace7e30fe60a4c268fd62a06a.png

下面说一下这三种相关系数的特点。

1、Pearsoncorrelation coefficient皮尔逊相关系数

它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。

该相关系数的前提条件最严格:

(1)成对数据;

(2)变量呈正态双分布;

(3)两列变量是连续变量;

(4)两列变量之间的关系是线性关系;

(5)数据间的差距不能太大。

所以我们用pearson相关系数之前要进行数据正态验证。

2、Kendall’stau-b correlation coefficient 肯德尔相关系数

它是一种秩相关系数,也就说它是做按顺序排列的数据相关分析,而且分析的对象是分类变量,比如说人的帅气程度(很帅、帅、一般帅、不帅),没有皮尔逊相关系数的那么多前提条件。

3、Spearman correlation coefficient 斯皮尔曼相关系数

由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来。它也是分析有顺序的数据相关性,有线性关系的数据,没有皮尔逊相关系数的那么多前提条件的约束。

所以说不是正态分布的数据,可以用后两种相关系数进行分析。

f901d2a66e3549cb6143a73dd86edff6.png

演示一下SPSS怎么操作

打开软件自带的数据集employee data,我们要分析初始工资和目前工资的相关性。

1、我们首先看一下他们的数据是否呈正态性

这里用到非参数检验(Nonparametric tests),即在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。其实也可以用其他方式进行正态检验,可参考下面参考文献。

这里就说一下非参数检验,如下图,依次点击分析→非参数检验→旧对话框→1-样本K-S,

d2cde070e5c76b62f0af3b7b20975060.png

这里面有个正态检验,翻译的是“常规”,这就是正态分布(Normal distribution),其他几个叫均匀分布、泊松分布、指数分布。我们把初始工资和当前工资放到检验变量列表。

3d473cf3c6f842eefa59dcc089fe2c70.png

点击确定,出结果,发现p<0.05,不是正态分布。那我们就不能用皮尔逊相关系数了(实际上实验数据一般与正态分布相差不大,可以用皮尔逊相关系数,这里就用斯皮尔曼相关系数了)。

52b50fc17b90a710e8e6b0865502171f.png

2、我们检验一下线性情况

这里用到散点图

如下图,依次点击图形→旧对话框→散点

e628a4305d10c27c2ac4ea5943074d89.png

选择第一个简单分布

7c79ef05955daa4a7eb6997406c4893c.png

将当前工资放入第一个Y轴,初始工资放入第二个X轴

7689554e1ecccb5a9fc9c5824e63468c.png

可以点击标题,加标题

ec85b07bf1fae056ccfc3120246f4eba.png

点击确定,出图,发现初始工资和目前工资,它们之间是呈线性关系的。

8186f43ec46503fd84014e954d3cab6e.png

3、进行相关分析

依次点击分析→相关→双变量

697304f0462599f09ba4be41e984c62f.png

把初始工资和目前工资放入变量内,选择斯皮尔曼相关系数,双尾检验,标记显著性相关。

f6d4df8f9776faf0c30a9ef94c133c6f.png

点击确定得到结果,发现他们的相关性是0.826,还是比较强相关的。

6f861f1751a47df81486595c27c78f9c.png

5ddc8c8a892d465eeef141e9d109b916.png

下面是一个补充内容,

距离的分析,

我们还是以初始工资和目前工资做分析。

如下图依次点击分析→相关→距离

4e13972e0906b2e3e72c2a91222bc54b.png

把初始工资和目前的工资放入变量,选择变量间,相似性,点击确定。

56d6f67603f3600bc08075f0049cf145.png

出结果,相关性0.880

dbc49b0e7813dc3acff28a06299147ec.png

我们求一下皮尔逊相关系数,发现跟距离的一样,可知,距离用的是皮尔逊方法。

dc207c4b8c4921ec9194c29bb686352c.png

参考文献:

[1]     统计学三大相关系数,

https://blog.csdn.net/zxyscz/article/details/82014694

[2]     几个相关系数:Pearson、Spearman、pointbiserialr、kendalltau,

https://blog.csdn.net/mmc2015/article/details/51942066

[3]     kendall秩相关系数,

https://baike.baidu.com/item/kendall%E7%A7%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/6246854?fr=aladdin

[4]     皮尔逊相关系数,

https://baike.baidu.com/item/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/12712835?fr=aladdin

[5]     spearman相关系数,

https://baike.baidu.com/item/spearman%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/7977847?fr=aladdin

[6]     spss如何进行正态性检验

https://jingyan.baidu.com/article/e6c8503cb5fc7be54e1a1860.html

[7]     赵小军,祁禄.SPSS数据分析:问题提出与实例导学[M].北京:中国水利水电出版社,2011。

欢迎讨论!

微信文章随笔,描述不当的地方,望指正!

若侵权,请联系本人删除!

欢迎大家投科学相关的稿件。

爱生活,爱科学!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值