相关系数学习

本文介绍了皮尔逊和斯皮尔曼两种相关系数的使用及其区别。皮尔逊系数适用于正态分布、线性关系的连续数据,强调线性相关性;而斯皮尔曼等级相关系数则更注重数据的等级顺序,适用于非线性关系。在数据分析中,需先通过散点图判断线性关系,再选用合适的系数评估相关程度。异常值可能会影响皮尔逊系数,而斯皮尔曼系数则相对稳健。
摘要由CSDN通过智能技术生成

常用的相关系数分为:皮尔逊person相关系数和斯匹尔曼spearman等级相关系数

首先其实知道协方差cov是可以得出变量的关系,但是这里的同等级的自变量之间无法进行比较,量纲不同

person系数就是根据协方差消除量纲而来,即将变量X、Y标准化后的协方差

1.person系数只是用来衡量两个变量线性相关程度的指标,注意是线性关系,假如系数不高,那只能说明不符合线性关系,不代表没有关系!

2.person系数的使用,必须是在你已经确定它们的关系是线性的情况下(比如看其散点图很明显是有线性关系的,才能person系数来说明他们线性相关程度的深浅

3.即使是非线性相关,其线性相关系数也很大,反过来,即使是线性相关,但存在离群点(异常值),其系数也会很小

4从第3点衍生,即使两个变量相关系数很大,也不代表其有线性关系,可能是存在异常点的非线性关系

所以,一定要画出散点图来看看其是否符合线性关系再从person系数来看,不符合就不用看下去了,符合才能看大小来判断符合程度

所用代码:R = corrcoef(x);

斯皮尔曼相关系数:R=corr(x,'type','spearman')

斯皮尔曼聚焦于等级测序,注重于逻辑,应用范围广,而person相关系数只能用在正态分布、线性关系、连续数据中

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值