- 相关性分析
积差相关又称积矩相关。是直线相关中最基本的一种相关。是20世纪初英国统计学家K.皮尔逊继续高尔顿的工作而提出的一种计算相关的方法,因而积差相关又称皮尔逊相关。两变量如果存在直线相关关系,要准确反映它们之间的相关情况,需要用统计方法计算相关系数。计算直线相关系数的方法很多,英国统计学家皮尔逊创立的由积差来求相关的方法最常用。相关系数r的值有一定范围,-1≤r≤1。绝对值越接近1,表示相关程度越大。r的正负表示相关的方向,r为正时,称为“正相关”。这时X与Y的变化方向相同,即X取值变大时,与之对应的Y的取值也变大。r为负时,称为“负相关”。X与Y变化方向相反。使用积差相关公式求直线相关系数还应满足一些条件:(1)变量X、Y都是连续性质的;(2)两变量总体都是接近正态分布的;(3)每对数据取值不影响其他对数据的取值,是互相独立的;(4)数据少时,例如N<30,
协方差(covariance)是积差相关系数的基础。协方差表示两个随机变量在多大程度上拥有相同的方差,是两个变量的离差乘积之和除以n所得之商。其计算公式如下:
当X与Y存在严格的线性关系时,数据的协方差可能达到最大值;当X与Y之间没有关系或它们的关系不能用一条直线来描述时,协方差等于0。协方差本身没有实际的意义,将它作为一个描述性的统计量,除以两个变量的标准差,便可算得相关系数
:
其中,
是变量X的标准差,
是变量Y的标准差。
计算出的r值很不可靠
- 斯皮尔曼等级相关
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
n为等级个数
d为二列成对变量的等级差数
假设当前有5个人的视觉、听觉反应时(单位:毫秒),数据如下表。请问视觉、听觉反应时是否具有一致性?
被试 | 听觉反应时 | 视觉反应时 | X | Y | d | d^2 | XY |
1 | 170 | 180 | 3 | 4 | -1 | 1 | 12 |
2 | 150 | 165 | 1 | 1 | 0 | 0 | 1 |
3 | 210 | 190 | 5 | 5 | 0 | 0 | 25 |
4 | 180 | 168 | 4 | 2 | 2 | 4 | 8 |
5 | 160 | 172 | 2 | 3 | -1 | 1 | 6 |
∑ | 870 | 875 | 15 | 15 | 6 | 52 |
解:此题被试5人,不知是否为正态分布,所以用斯皮尔曼等级相关解题。其中,x为听觉反应时间按大小排序,y为视觉反应时间按大小排序。d=x-y。
将n=5,∑d^2=6 带入公式 1-[6·∑(di)^2 / (n^3 - n)]
得:ρ=0.7
答:这5人的视听反应时等级相关系数为0.7,属于高度相关。
优点
适用范围广泛,斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。 [2]
缺点
一组能用积差相关计算的数据,如果改用等级相关,精确度会低于积差相关。凡符合积差相关条件的,最好不要用等级相关计算。