Pearson相关系数是一种用于衡量两个连续型变量之间线性关系强度的统计指标。它衡量了两个变量之间的线性关联程度,取值范围在-1到1之间。
Pearson相关系数的计算公式如下:
其中,xi 和 yi 是样本数据中的第 i 对观测值,xˉ 和 yˉ 分别是 x 和 y 的均值。
Pearson相关系数的取值有以下含义:
- r=1:表示完全正相关,即两个变量随着增大而线性增大。
- r=−1:表示完全负相关,即一个变量随着增大而另一个变量线性减小。
- r=0:表示无线性关系,但并不代表两个变量之间没有其他关系。
- 0<r<1:表示正相关,即一个变量增大时另一个变量也趋向增大,但不一定是线性的。
- −1<r<0:表示负相关,即一个变量增大时另一个变量趋向减小,但不一定是线性的。
需要注意的是,Pearson相关系数只能反映线性关系,对于非线性关系可能无法准确反映两个变量之间的关系强度。如果你想了解更多关于两个变量之间关系的信息,可能需要考虑其他类型的相关系数或分析方法。