正负相关 最大信息系数mic_数据分析(九):相关分析方法

a8925a1d9318a68f18c443377ebf69b6.png

一. 相关分析

1.1 定义

对比两组及以上数据之间的相关数据,用于分析部分数据对整体数据的相关程度与相关关系。

1.2 相关系数

用来衡量两组数据中的相关程度用字母R来表示。相关系数的数值大小可以表示两组数据的相关程度。相关系数的变化范围的极端值为"-1"、"0"、"+1"。正负符号到代表两个数据变量的相关方向(正相关、负相关、非线性相关)

5788d0b8a17553bff0b92c1a72ebc0f6.png

相关程度:判断相关系数的程度,正负相关系数按0.3平均分

d241e8e1d3f1d04fa656cae0961c8c95.png
  • 弱程度相关:在-0.3至0.3之间
  • 中程度相关:-0.6至-0.3 和 0.3至0.6
  • 高程度相关:-1至-0.6 和 0.6至1

二 .应用案例

2.1 相关数据案例

例如分析学习时间与学习成绩之间的相关关系(数据信息如下),使用Excel使用数据分析工具进行数据可视化,得到相关系矩阵。若值大于0.6则表示学习成绩与学习时间是高度正相关数据

141183971f3b62f717d3664c4fcac49d.png

2.2 散点图异常值

对获得的数据进行可视化获得成绩散点图,并可已更直观的发现数据中的异常值

239fd388fc706097edd8f9106fb787c9.png

三. 总结

3.1 解决方法

11d00a8b232fe7c422137469305667dd.png

在通过一系列分析方法分析出目标问题的影响因素后,由于实际业务中多种资源条件限制。会对可能的影响因素进行相关性分析,分析出相关程度并决定要解决的影响因素的优先顺序(通过之前文章的假设检验等分析方法解决)

(A的发生会导致B,B的发生因为A)单一变量的控制不一定导致相关结果,相关关系不完全等于因果关系

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值