一. 相关分析
1.1 定义
对比两组及以上数据之间的相关数据,用于分析部分数据对整体数据的相关程度与相关关系。
1.2 相关系数
用来衡量两组数据中的相关程度用字母R来表示。相关系数的数值大小可以表示两组数据的相关程度。相关系数的变化范围的极端值为"-1"、"0"、"+1"。正负符号到代表两个数据变量的相关方向(正相关、负相关、非线性相关)
相关程度:判断相关系数的程度,正负相关系数按0.3平均分
- 弱程度相关:在-0.3至0.3之间
- 中程度相关:-0.6至-0.3 和 0.3至0.6
- 高程度相关:-1至-0.6 和 0.6至1
二 .应用案例
2.1 相关数据案例
例如分析学习时间与学习成绩之间的相关关系(数据信息如下),使用Excel使用数据分析工具进行数据可视化,得到相关系矩阵。若值大于0.6则表示学习成绩与学习时间是高度正相关数据
2.2 散点图异常值
对获得的数据进行可视化获得成绩散点图,并可已更直观的发现数据中的异常值
三. 总结
3.1 解决方法
在通过一系列分析方法分析出目标问题的影响因素后,由于实际业务中多种资源条件限制。会对可能的影响因素进行相关性分析,分析出相关程度并决定要解决的影响因素的优先顺序(通过之前文章的假设检验等分析方法解决)
(A的发生会导致B,B的发生因为A)单一变量的控制不一定导致相关结果,相关关系不完全等于因果关系