【统计学】三大相关系数之斯皮尔曼相关系数(spearman correlation coefficient)

本文介绍了斯皮尔曼相关系数,作为统计学中的排名相关工具,适用于处理等级和顺序数据。内容包括其使用场景、理解及Python代码实现,并强调在数据分析面试中的应用价值。
摘要由CSDN通过智能技术生成

斯皮尔曼相关系数是统计学中三大相关系数之一
具有非常好的使用场景,对于解决我们生活中的排名类的问题时使用的比较多,其实大家更多的知道的相关系数是皮尔逊(person)相关系数,这个相关系数我们也会在后面的文章中介绍。
一、斯皮尔曼相关系数的使用场景:
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决名称数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
二、斯皮尔曼(spearman)相关系数的理解
斯皮尔曼相关性系数,通常也叫斯皮尔曼秩相关系数。“秩”,可以理解成就是一种顺序或者排序,那么它就是根据原始数据的排序位置进行求解
(1)公式
首先对两个变量(X, Y)的数据进行排序,然后记下排序以后的位置(X’, Y’),(X’, Y’)的值就称为秩次,秩次的差值就是上面公式中的di,n就是变量中数据的个数,最后带入公式就可求解结果。

(2)数据要求
因为是定序,所以我们不用管X和Y这两个变量具体的值到底差了多少,只需要算一下它们每个值所处的排列位置的差值,就可以求出相关性系数了
小猪课堂
三、斯皮尔曼(spearman)相关系数的python代码实现

import pandas as pd
import numpy as np
X1=pd.
  • 22
    点赞
  • 96
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
皮尔逊相关系数斯皮尔曼相关系数和肯德尔相关系数是用来衡量两个变量之间相关程度的统计指标,它们在计算方法和适用场景上有所不同。 1. 皮尔逊相关系数Pearson correlation coefficient)是最常用的相关系数之一,用于衡量两个变量之间的线性相关程度。它的取值范围在-1到1之间,其中-1表示完全负相关,1表示完全正相关,0表示无相关。皮尔逊相关系数假设变量之间的关系是线性的,并且对异常值敏感。 2. 斯皮尔曼相关系数(Spearman correlation coefficient)是一种非参数的相关系数,用于衡量两个变量之间的单调相关程度。它通过将原始数据转换为秩次来计算相关系数,因此不受异常值的影响。斯皮尔曼相关系数的取值范围也在-1到1之间,具有与皮尔逊相关系数相似的解释。 3. 肯德尔相关系数(Kendall correlation coefficient)也是一种非参数的相关系数,用于衡量两个变量之间的顺序相关程度。它通过比较两个变量的排序顺序来计算相关系数,因此适用于有序变量或者无法满足线性假设的情况。肯德尔相关系数的取值范围在-1到1之间,具有与皮尔逊相关系数斯皮尔曼相关系数相似的解释。 总结来说,皮尔逊相关系数适用于线性关系,斯皮尔曼相关系数适用于单调关系,肯德尔相关系数适用于顺序关系。根据变量之间的关系类型和数据的特点,选择合适的相关系数进行分析。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值