数理统计01：线性相关性系数，斯皮尔曼相关性系数计算及详解

最新推荐文章于 2025-03-08 08:00:00 发布

向东的笔记本

最新推荐文章于 2025-03-08 08:00:00 发布

阅读量5.1w

点赞数 15

分类专栏：数学知识文章标签：相关性系数斯皮尔曼相关系数线性相关系数

本文链接：https://blog.csdn.net/gaifuxi9518/article/details/88849283

版权

数学知识专栏收录该内容

1 篇文章

订阅专栏

本文介绍了三种衡量变量间相关性的统计指标：线性相关系数、斯皮尔曼相关性系数及肯德尔相关性系数。详细解释了如何计算线性相关系数，并通过秩值评估变量之间的单调关系来计算斯皮尔曼相关性系数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在统计学中有三个可以衡量两个变量之间相关程度的指标：线性相关系数（linear correlation coefficient）、斯皮尔曼相关性系数（Spearman’s rank correlation coefficient）、肯德尔相关性系数（kendall correlation coefficient）。

这三个相关性系数可以衡量出两个变量变化的相同程度，现有两个变量X、Y。如果X变大的同时Y也在变大，那么他俩呈现正相关，他俩之间的相关性系数值趋近于+1；如果X变大的同时Y反而在变小，那么他俩呈现负相关，他俩之间的相关性系数值趋近于-1；如果X变大的同时Y没有任何有规律的变化，那么他俩没有相关性，他俩之间的相关性系数值趋近于0；

1.线性相关系数计算

线性相关系数评估两个连续变量之间的线性关系。当一个变量中的变化与另一个变量中的成比例变化相关时，这两个变量具有线性关系。例如，您可能使用 Pearson 相关来评估您生产设施温度的升高是否与巧克力涂层的厚度减少有关。

1.1 计算公式

在这里插入图片描述
分子是两个变量的协方差，协方差是统计学中使用的一种数值，用于描述两个变量间的线性关系。两个变量的协方差越大，它们在一系列数据点范围内的取值所呈现出的趋势就越相近（换句话说，两个变量的曲线距离彼此较近）。
在这里插入图片描述
在上面的公式中，X_i代表的是变量X中的第i个元素，头顶带横的X表示变量X的均值。变量Y与X一致。
线性相关系数的分母是两个变量标准差的乘积，标准差可以描述样本中的数据分布。一个变量的标准差的计算步骤如下：

计算数据的均值
计算数据的方差
对方差开方得到标准差

1.2 注意事项

注意，计算线性相关系数的时候分母不能为0，也就是变量X、Y的方差不能为0，什么时候方差为0呢？方差为0意味着所有的数据都必须和平均值相等，那么这些数据都等于平均值。也就是这些数据都相等。

2. 斯皮尔曼相关性系数计算

Spearman 相关评估两个连续或顺序变量之间的单调关系。在单调关系中，变量倾向于同时变化，但不一定以恒定的速率变化。Spearman 相关系数基于每个变量的秩值（而非原始数据）。

Spearman 相关通常用于评估与顺序变量相关的关系。例如，您可能会使用 Spearman 相关来评估员工完成检验练习的顺序是否与他们工作的月数相关。

1.1计算公式

斯皮尔曼相关性系数，通常也叫斯皮尔曼秩相关系数。“秩”，可以理解成就是一种顺序或者排序，那么它就是根据原始数据的排序位置进行求解，这种表征形式就没有了求皮尔森相关性系数时那些限制。下面来看一下它的计算公式：
斯皮尔曼相关系数
n表示数据的数量，d_i 表示两个数据次序的差值：
在这里插入图片描述
比如这里有两个变量X、Y，刚开始这两个变量中的值都是随意排放的，位置从1-6。先将它们进行排序：
斯皮尔曼相关系数计算举例
排序前数字11位置在1，排序后变成了5；490排序前的位置是2，排序后的位置变成了1。以此类推，得到了变量X 和Y排序后的位置。