Python Pandas 对每行(column)进行运算——以Pearson相关系数为例
在统计学中,皮尔逊积矩相关系数(Pearson’s r)用于度量两个变量X和Y之间的相关程度(线性相关),其值介于-1与1之间。系数为正,表示 Y 随着 X 的增加而增加;系数为负,表示Y 随着 X 的增加而减少。
r 可由(Xi, Yi)样本点的标准分数均值估计,公式为:
r = 1 n − 1 ∑ i = 1 n ( x i − x ˉ σ x ) ( y i − y ˉ σ y ) r = \frac {1} {n-1} \sum_{i=1}^{n}(\frac{ x_i- \bar x} {\sigma x})(\frac{y_i- \bar y}{\sigma y}) r=n−11i=1∑n(σxxi