一、相关程度的划分:
- 按变量的多少划分:单相关,复相关; ** 一般只讨论一对一;
- 按表现形态划分:直线相关,曲线相关; ** 默认只讨论直线相关;
- 从变动的方向划分:正相关,负相关;
- 按相关的程度不同分:完全相关(1),统计相关,完全无关(0); ** 只讨论统计相关;
二、协方差
自己与自己的协方差即为方差。
1、公式:
2、判断方向:
3、相关系数
值在[-1,1]之间,大小表示Y与X之间线性相关的强弱,正负表示方向;
3.1、皮尔逊相关系数:
皮尔逊相关系数特点:
- 俩个连续性变量;
- 只能度量线性相关;
- 易受离群值的影响;
通过画散点图过滤掉皮尔逊相关系数的缺点
3.2、各相关系数:
- 皮尔逊相关系数:两个连续型变量的相关系数;
- 肯德尔相关系数:一个连续一个分类(最好是定序变量);
- 斯皮尔曼相关系数:都可以,但会损失信息,尽量不用;
3.3、相关程度:
必须建立在相关系数通过显著性检验的基础之上。
- |r|>0.8:高度相关;
- 0.5<|r|<0.8:中度相关;
- 0.3<|r|<5:低度相关;
- |r|<0.3时:不相关;