import scipy.stats as stats
import pandas as pd
- 采用stats.pearsonr(,)
输出:r: 相关系数 [-1,1]之间,p-value: p值。
注: p值越小,表示相关系数越显著,一般p值在500个样本以上时有较高的可靠性。
# way one
stats.pearsonr(data1,data2)
# way two
df.corr(method=) # 可选'pearson'(常见), 'kendall', 'spearman'