pearson相关系数_Pearson, Spearman, Kendall 三大相关系数简单介绍

d69ad4403f4c499656710e0810039184.png

Pearson, Spearman, Kendall 三类相关系数是统计学上的三大重要相关系数,表示两个变量之间变化的趋势方向和趋势程度。下面对这三类系数做简单的介绍。

1、Pearson 相关系数(连续变量)

公式:

99b64c45e6b5aa3a6cc9008bdd245e4a.png

假设条件:

a) 两个变量分别服从正态分布,通常用t检验检查相关系数的显著性;

b) 两个变量的标准差不为0。

结论:

pearson 描述的是线性相关关系,取值[-1, 1]。负数表示负相关,正数表示正相关。在显著性的前提下,绝对值越大,相关性越强。绝对值为0, 无线性关系;绝对值为1表示完全线性相关。

python3.6应用 :

a) Dataframe.corr(method='pearson'), 返回相关关系矩阵

b) from scipy.stats import normaltest, probplot

normaltest(a)返回统计数和检验P值, 样本要求>20。

probplot(np.array(x,y), dist="norm", plot=pylab) 化PP图,若在对角线,则相关性强。

2、Spearman 秩相关系数(连续变量)

公式:

1ea9eb3558638940b927d0bb03002989.png

结论:无参数的等级相关系数,亦即其值与两个相关变量的具体值无关,而仅仅与其值之间的大小关系有关。di表示两个变量分别排序后成对的变量位置差,N表示N个样本,减少异常值的影响。

python3.6应用 :

a) Dataframe.corr(method='spearman'), 返回相关关系矩阵

b) from scipy.stats import spearmanr

spearmanr(array)返回 Spearman 系数(系数矩阵)和检验P值, 样本要求>20。

3、Kendall 相关系数 (有序分类变量)

公式:

3d477742a26be90142891d41c5d7c155.png
任意一对(xi, yi)(xj, yj) 如果xi>=xj and yi>=yj, 则这一对和谐,若xi>xj and yi<yj, 则不和谐

79fe507d542a9632e2027bd4aa3294a3.png

结果:属于等级相关系数。排序一致,则为1, 排序完全相反则为-1。

python3.6应用 :

a) Dataframe.corr(method='kendall'), 返回相关关系矩阵

b) from scipy.stats import kendalltau

kendalltau(x, y) 返回系数和P值

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值