复盘:pearson皮尔森相关系数和spearman斯皮尔曼相关系数的区别

复盘:pearson皮尔森相关系数和spearman斯皮尔曼相关系数的区别

提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性

关于互联网大厂的笔试面试,都是需要细心准备的
(1)自己的科研经历,科研内容,学习的相关领域知识,要熟悉熟透了
(2)自己的实习经历,做了什么内容,学习的领域知识,要熟悉熟透了
(3)除了科研,实习之外,平时自己关注的前沿知识,也不要落下,仔细了解,面试官很在乎你是否喜欢追进新科技,跟进创新概念和技术
(4)准备数据结构与算法,有笔试的大厂,第一关就是手撕代码做算法题
面试中,实际上,你准备数据结构与算法时以备不时之需,有足够的信心面对面试官可能问的算法题,很多情况下你的科研经历和实习经历足够跟面试官聊了,就不需要考你算法了。但很多大厂就会面试问你算法题,因此不论为了笔试面试,数据结构与算法必须熟悉熟透了
秋招提前批好多大厂不考笔试,直接面试,能否免笔试去面试,那就看你简历实力有多强了。


pearson和spearman的区别

相关系数是用以反映变量之间的相关关系程度的统计指标。

其取值范围是[-1,1],
当取值为0时表示不相关,
取值为[-1,0)表示负相关,
取值为(0,1],表示正相关。

目前常用的两种相关性系数为皮尔森相关系数(Pearson)斯皮尔曼等级相关系数(Spearman)

皮尔森相关系数评估两个连续变量之间的线性关系

在这里插入图片描述
其中:
在这里插入图片描述
-1 ≤ p ≤ 1
p接近0代表无相关性
p接近1或-1代表强相关性

斯皮尔曼相关系数评估两个连续变量之间的单调关系。

在单调关系中,变量趋于一起变化,但不一定以恒定速率变化。

在这里插入图片描述
在这里插入图片描述
N是观测值的总数量

斯皮尔曼另一种表达公式:也是最常用的更好理解的表达式
在这里插入图片描述
表示二列成对变量的等级差数。

区别

Pearson和Spearman相关系数的范围可以从-1到+1。

当Pearson相关系数为+1时,意味着,当一个变量增加时,另一个变量增加一致量。
这形成了一种递增的直线。
在这种情况下,Spearman相关系数也是+1。

在这里插入图片描述
如果关系是一个变量在另一个变量增加时增加,但数量不一致,
则Pearson相关系数为正但小于+1。

但是在这种情况下,斯皮尔曼系数仍然等于+1。
在这里插入图片描述
Pearson=+ 0.851,Spearman=+1

当关系是随机的或不存在时,则两个相关系数几乎为零。
在这里插入图片描述
Pearson=-0.093,Spearman=-0.093

如果关系递减的直线,那么两个相关系数都是-1。
在这里插入图片描述
Pearson=-1,Spearman=-1

如果关系是一个变量在另一个变量增加时减少,但数量不一致,
则Pearson相关系数为负但大于-1。

但是在这种情况下,斯皮尔曼系数仍然等于-1
在这里插入图片描述
Pearson=-0.799,Spearman=-1

相关值-1或1意味着精确的线性关系,如圆的半径和圆周之间的关系。

然而,相关值的实际价值在于量化不完美的关系。
发现两个变量是相关的经常通知回归分析,该分析试图更多地描述这种类型的关系。

其他非线性关系

Pearson相关系数仅评估线性关系

Spearman相关系数仅评估单调关系

因此,即使相关系数为0,也可以存在有意义的关系。
检查散点图以确定关系的形式。
在这里插入图片描述
系数为0

该图显示了非常强的关系。

Pearson系数和Spearman系数均约为0。

结论

皮尔森评估的是两个变量的线性关系,而斯皮尔曼评估的两变量的单调关系。

Pearson 处理变量的数据原始值,而 Spearman 处理数据排序值(需要先做变换,transform)

因此,斯皮尔曼相关系数对于数据错误和极端值的反应不敏感。

如果散点图表明“可能是单调的,可能是线性的”关系,
最好的选择是 Spearman 而不是 Pearson。

即使数据证明是完全线性的,用 Spearman 也不会造成信息丢失。

但是,如果不是完全线性但使用 Pearson 系数,会丢失 Spearman 可以捕获的信息,是否单调。


总结

提示:重要经验:

1)皮尔森评估的是两个变量的线性关系,而斯皮尔曼评估的两变量的单调关系
2)Pearson 处理变量的数据原始值,而 Spearman 处理数据排序值(需要先做变换,transform)
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

  • 8
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冰露可乐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值