Pearson皮尔逊,Kendall肯德尔和Spearman斯皮尔曼三种相关分析方法的异同

在SPSS软件相关分析中,pearson(皮尔逊),kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同
         
两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述。相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。相关性不等于因果性,也不是简单的个性化,相关性所涵盖的范围和领域几乎覆盖了我们所见到的方方面面,相关性在不同的学科里面的定义也有很大的差异。
 
        Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。
 
        Kendall'stau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;
 
      计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据;计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。
 
      计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用 spearman或kendall相关
 
        Pearson 相关复选项积差相关计算连续变量或是等间距测度的变量间的相关分析 
Kendall 
      复选项 等级相关 计算分类变量间的秩相关,适用于合并等级资料
 
        Spearman     复选项等级相关计算斯皮尔曼相关,适用于连续等级资料
注:
1若非等间距测度的连续变量 因为分布不明-可用等级相关/也可用Pearson相关,对于完全等级离散变量必用等级相关
2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用 Spearman 或 Kendall相关。
3 若不恰当用了Kendall等级相关分析则可能得出相关系数偏小的结论。则若不恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。

在SPSS里进入Correlate-》Bivariate,在变量下面CorrelationCoefficients复选框组里有3个选项:
 
   Pearson
 
   Kendall'stau-b
 
  Spearman:Spearman

spearman(斯伯曼/斯皮尔曼)相关系数
 
    斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法”
 
    斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。

Kendall's相关系数
 
    肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。

     肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j差记0,两者相同则记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。

正态分布的相关检验
 
     对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。
 
    进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。
 
    U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。
 
    虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。
 
    均值检验时不同的数据使用不同的统计量
 
    使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。
 
    检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。
 
    检验两个不相关的样本是否来自来具有相同均值的总体,用Independent-Samples T test独立样本t检验过程。
 
    如果分组样本不独立,用Paired Sample T test 配对t检验。
 
    如果分组不止两个,应使用One-WayANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。
 
   如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametric test.
 
   如果用户相比较的变量是分类变量,应该使用Crosstabs功能。
 
   当样本值不能为负值时用右侧单边检验。

  • 8
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
皮尔逊相关系数、斯皮尔曼相关系数和肯德尔相关系数是用来衡量两个变量之间相关程度的统计指标,它们在计算方法和适用场景上有所不同。 1. 皮尔逊相关系数(Pearson correlation coefficient)是最常用的相关系数之一,用于衡量两个变量之间的线性相关程度。它的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无相关。皮尔逊相关系数假设变量之间的关系是线性的,并且对异常值敏感。 2. 斯皮尔曼相关系数(Spearman correlation coefficient)是一种非参数的相关系数,用于衡量两个变量之间的单调相关程度。它通过将原始数据转换为秩次来计算相关系数,因此不受异常值的影响。斯皮尔曼相关系数的取值范围也在-1到1之间,具有与皮尔逊相关系数相似的解释。 3. 肯德尔相关系数(Kendall correlation coefficient)也是一种非参数的相关系数,用于衡量两个变量之间的顺序相关程度。它通过比较两个变量的排序顺序来计算相关系数,因此适用于有序变量或者无法满足线性假设的情况。肯德尔相关系数的取值范围在-1到1之间,具有与皮尔逊相关系数和斯皮尔曼相关系数相似的解释。 总结来说,皮尔逊相关系数适用于线性关系,斯皮尔曼相关系数适用于单调关系,肯德尔相关系数适用于顺序关系。根据变量之间的关系类型和数据的特点,选择合适的相关系数进行分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值