R计算两列数据的相关系数_数据特征分析·相关性分析

58b31de30f53f8899e54407c60723ee4.png

相关性分析

相关分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度,相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。

1、 如何利用相关系数判断数据之间的关系

(1) 绘制散点图

判断数据是否具有相关关系,最直观的方法就是绘制散点图

1325a0a1ba7e6c60b768579196ba10a5.png

如何要判断多个数据的之间的关系,散点图的绘制就会显得比较繁琐,这时候要选择绘制散点矩阵

313b4e5ae118ab324e7cff5b3b3d7eaf.png

(2) 相关系数

相关系数衡量了两个变量的统一程度,范围是-1~1,‘1’代表完全正相关,‘-1’代表完全负相关。

比较常用的是Pearson‘皮尔逊’相关系数Spearman‘斯皮尔曼’相关系数

a) Pearson相关系数

也称皮尔森积矩相关系数,一般用于分析,两个连续变量之间的关系,是一种线性相关系数,公式为:

9e77ffd242fe28c1aca44049a1dccb1f.png

补充:

|r|<= 0.3 不存在线性相关

0.3<=|r|<= 0.5 低度线性关系

0.5<=|r|<= 0.8 显著线性关系

|r| > 0.8 高度线性关系

b) Spearman相关系数

Pearson相关系数要求连续变量的取值服从正态分布,不服从正态分布的变量、分类或等级变量之间的关联性可采用Spearman秩相关系数,也称等级相关系数来描述。公式:

e8f89386358b92304aa547e4d6aaa7b2.png

对两个变量成对的取值分别按照从小到大(或者从大到小)顺序编秩

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值