pearson相关系数:用于判断数据是否线性相关的方法。
注意:不线性相关并不代表不相关,因为可能是非线性相关。
Python计算pearson相关系数:
1. 使用numpy计算(corrcoef),以下是先标准化再求相关系数
importnumpy as npimportpandas as pd
aa= np.array([2,3,9,6,8])
bb= np.array([5,6,3,7,9])
cc=np.array([aa, bb])print(cc)
cc_mean= np.mean(cc, axis=0) #axis=0,表示按列求均值 ——— 即第一维
cc_std = np.std(cc, axis=0)
cc_zscore= (cc-cc_mean)/cc_std #标准化
cc_zscore_corr= np.corrcoef(cc_zscore) #相关系数矩阵
print(cc_zscore_corr)
其中:
def corrcoef(x, y=None, rowvar=True, bias=np._NoValue, ddof=np._NoValue):"""Return Pearson product-moment correlation coefficients.
Please refer to the documentation for `cov` for more detail. The
relationship between the correlatio