皮尔逊相关系数(Pearson Correlation Coefficient)
起源
皮尔逊相关系数是由英国统计学家卡尔·皮尔逊(Karl Pearson)于1896年提出的,用于衡量两个变量之间的线性关系。皮尔逊的工作受到弗朗西斯·高尔顿(Francis Galton)研究的启发,他研究了遗传和统计相关性的问题。皮尔逊通过改进高尔顿的方法,提出了这种更加精确的相关性度量方式。
介绍
皮尔逊相关系数通过计算两个变量的协方差和标准差来量化它们之间的线性关系。其值在-1到1之间,1表示完全正相关,-1表示完全负相关,0表示没有线性关系。公式如下:
r = ∑ ( X i − X ‾ ) ( Y i − Y ‾ ) ∑ ( X i − X ‾ ) 2 ∑ ( Y i − Y ‾ ) 2 r = \frac{\sum{(X_i - \overline{X})(Y_i - \overline{Y})}}{\sqrt{\sum{(X_i - \overline{X})^2} \sum{(Y_i - \overline{Y})^2}}} r=∑(X