相关分析-如何选用Pearson、Spearman、Kendall三大相关系数

说到相关分析,很多人会马上拿出皮尔逊Pearson相关系数,从不论数据是不是符合适用条件,甚至完全不了解Pearson相关系数还有假设条件这回事。

常见的相关系数有三种,它们分别是Pearson、Spearman、Kendall系数,世人兼知pearson系数,冷淡了另外两个。

非常重要的一个知识点是:Pearson系数不是万能的,不满足适用条件时我们需要使用另外两个。

三大相关系数如何选用呢,小兵给大家作个小结。

一、变量类型

考察两个变量的相关关系,首先得看清楚两个变量都是什么类型的。统计分析中常见的变量类型有连续型数值变量,无序分类变量、有序分类变量。

连续型数值变量:如销售额、气温、工资收入、考试成绩;

无序分类变量:如性别男和女,血型种类;

有序分类变量:如学历水平小学、初中、高中、大学、研究生;

二、两个连续数值变量相关关系

X1和X2都是连续型数值变量,比如考察某班学生体重和肺活量之间的关系&#x

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Spearman相关系数Kendall等级相关系数Pearson相关系数都是衡量两个变量之间线性相关性的指标,但它们在计算方法和应用场景上略有不同。 Pearson相关系数是衡量两个连续变量之间的线性关系强度和方向的指标,它的范围在-1到1之间,0表示无相关性,正值表示正相关性,负值表示负相关性。它假定数据服从正态分布,且变量之间的关系是线性的。 Spearman相关系数是衡量两个变量之间的单调关系的指标,它的范围在-1到1之间,0表示无相关性,正值表示正单调相关性,负值表示负单调相关性。它不需要数据服从正态分布,只要变量是有序的或能转化为有序的,就可以使用Spearman相关系数来衡量它们的相关性。 Kendall等级相关系数也是衡量两个变量之间的单调关系的指标,与Spearman相关系数类似,但Kendall等级相关系数更适用于小样本数据,它的计算方法是通过比较两个变量的等级来计算它们之间的相关性。Kendall等级相关系数的范围也在-1到1之间,0表示无相关性,正值表示正单调相关性,负值表示负单调相关性。 在实际应用中,选择何种相关系数要根据数据类型和研究问题的需要来确定。如果数据是连续的且符合正态分布,可以使用Pearson相关系数来衡量它们之间的关系。如果数据是有序的或能转化为有序的,可以使用SpearmanKendall等级相关系数来衡量它们之间的单调关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值