斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)

在这里插入图片描述

斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决名称数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。

斯皮尔曼等级相关计算公式:

其中:di=xi-yi表示两个排序之间的差值;
n:表示样本的大小,即机器学习算法的数量;

优点

适用范围广泛,斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究。

缺点

一组能用积差相关计算的数据,如果改用等级相关,精确度会低于积差相关。凡符合积差相关条件的,最好不要用等级相关计算。

pearsonr皮尔森共线系数要求:

1.每个变量数据集符合正态分布

2. p值代表极端值出现概率,样本量小时p值不可靠,但样本量大于500时,p值具有很大参考价值。
在这里插入图片描述需要检验正态分布
正态分布JB检验 【N>30】
在这里插入图片描述偏度的补充介绍
在这里插入图片描述

python的scipy有皮尔森和斯皮尔曼方法的详细解读和代码实现,官网如下图:


得到答案 可视化跟显著性二选一
在这里插入图片描述

斯皮尔曼等级相关应用

解:此题被试5人,不知是否为正态分布,所以用斯皮尔曼等级相关解题。其中,x为听觉反应时间按大小排序,y为视觉反应时间按大小排序。d=x-y。

将n=5,∑d^2=6 带入公式 1-[6·∑(di)^2 / (n^3 - n)]

得:ρ=0.7

答:这5人的视听反应时等级相关系数为0.7,属于高度相关。

积差相关术语

积差相关又称积距相关,是当两个变量都是正态连续变量,两者之间呈线性关系时,表示这两个变量之间的相关
使用条件
积差相关的使用条件是:
1、两变量为连续变量,即变量数值取自等距或等比量表。
2、两变量呈线性关系,这可由相关的散布图的形状来描述。
3、两变量为正态分布,或接近正态分布,至少是单峰对称的分布。
4、必须是成对数据,每对数据之间相互独立。
5、要排除共同因素的影响。如果两个变量都随着一个共同因素在变化,即使算出的积差相关系数很高,也难以判断两个变量之间存在高度相关。
6、样本容量大于30,计算出的积差相关系数才有意义。

参考
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.pearsonr.html
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.spearmanr.html
http://www.360doc.com/content/08/1228/23/50235_2219531.shtml
http://blog.csdn.net/lhkaikai/article/details/37352587

版权声明:文章来自公众号(python风控模型),未经许可,不得抄袭。遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

欢迎学习csdn学院更多金融风控相关知识《python金融风控评分卡模型和数据分析》
在这里插入图片描述

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python机器学习建模

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值