之前写过一个用excel做的相关系数文章《用Excel做数据间的相关系数》(点击查看),可以再次温习。
那么今天主要讲一下用SPSS做相关分析。
Excel的数据分析能力比SPSS还是稍微弱一点的,毕竟SPSS也是主要分析数据的一个软件,那么在相关分析的这里就凸显了它的强大之处,您再次读这篇文章《用Excel做数据间的相关系数》,会发现,Excel中的相关系数的分析只是皮尔逊(Pearson)相关分析。而SPSS中包括了三种相关分析(Pearson/ Kendall’s tau-b / Spearman)。
世间万物除了因果关系、共变关系还有相关关系。相关关系中分为正相关、负相关和不相关,体现在数字上就是[-1,1]。若想形象的表示两种数据之间的关系,可以制作一个相关关系散点图。相关还有偏相关,偏相关是指将其他变量影响予以排除,求两个变量之间的关系。这些用SPSS软件都能做到。
下面说一下这三种相关系数的特点。
1、Pearsoncorrelation coefficient皮尔逊相关系数
它是由卡尔·皮尔逊从弗朗西斯·高尔顿在19世纪80年代提出的一个相似却又稍有不同的想法演变而来的。
该相关系数的前提条件最严格:
(1)成对数据;
(2)变量呈正态双分布;
(3)两列变量是连续变量;
(4)两列变量之间的关系是线性关系;
(5)数据间的差距不能太大。
所以我们用pearson相关系数之前要进行数据正态验证。
2、Kendall’stau-b correlation coefficient 肯德尔相关系数
它是一种秩相关系数,也就说它是做按顺序排列的数据相关分析,而且分析的对象是分类变量,比如说人的帅气程度(很帅、帅、一般帅、不帅),没有皮尔逊相关系数的那么多前提条件。
3、Spearman correlation coefficient 斯皮尔曼相关系数
由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来。它也是分析有顺序的数据相关性,有线性关系的数据,没有皮尔逊相关系数的那么多前提条件的约束。
所以说不是正态分布的数据,可以用后两种相关系数进行分析。
演示一下SPSS怎么操作
打开软件自带的数据集employee data,我们要分析初始工资和目前工资的相关性。
1、我们首先看一下他们的数据是否呈正态性
这里用到非参数检验(Nonparametric tests),即在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。其实也可以用其他方式进行正态检验,可参考下面参考文献。
这里就说一下非参数检验,如下图,依次点击分析→非参数检验→旧对话框→1-样本K-S,
这里面有个正态检验,翻译的是“常规”,这就是正态分布(Normal distribution),其他几个叫均匀分布、泊松分布、指数分布。我们把初始工资和当前工资放到检验变量列表。
点击确定,出结果,发现p<0.05,不是正态分布。那我们就不能用皮尔逊相关系数了(实际上实验数据一般与正态分布相差不大,可以用皮尔逊相关系数,这里就用斯皮尔曼相关系数了)。
2、我们检验一下线性情况
这里用到散点图
如下图,依次点击图形→旧对话框→散点
选择第一个简单分布
将当前工资放入第一个Y轴,初始工资放入第二个X轴
可以点击标题,加标题
点击确定,出图,发现初始工资和目前工资,它们之间是呈线性关系的。
3、进行相关分析
依次点击分析→相关→双变量
把初始工资和目前工资放入变量内,选择斯皮尔曼相关系数,双尾检验,标记显著性相关。
点击确定得到结果,发现他们的相关性是0.826,还是比较强相关的。
下面是一个补充内容,
距离的分析,
我们还是以初始工资和目前工资做分析。
如下图依次点击分析→相关→距离
把初始工资和目前的工资放入变量,选择变量间,相似性,点击确定。
出结果,相关性0.880
我们求一下皮尔逊相关系数,发现跟距离的一样,可知,距离用的是皮尔逊方法。
参考文献:
[1] 统计学三大相关系数,
https://blog.csdn.net/zxyscz/article/details/82014694
[2] 几个相关系数:Pearson、Spearman、pointbiserialr、kendalltau,
https://blog.csdn.net/mmc2015/article/details/51942066
[3] kendall秩相关系数,
https://baike.baidu.com/item/kendall%E7%A7%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/6246854?fr=aladdin
[4] 皮尔逊相关系数,
https://baike.baidu.com/item/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/12712835?fr=aladdin
[5] spearman相关系数,
https://baike.baidu.com/item/spearman%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/7977847?fr=aladdin
[6] spss如何进行正态性检验
https://jingyan.baidu.com/article/e6c8503cb5fc7be54e1a1860.html
[7] 赵小军,祁禄.SPSS数据分析:问题提出与实例导学[M].北京:中国水利水电出版社,2011。
欢迎讨论!
微信文章随笔,描述不当的地方,望指正!
若侵权,请联系本人删除!
欢迎大家投科学相关的稿件。
爱生活,爱科学!