目录
定类 | 定序 | 定距 | |
---|---|---|---|
定类 | 卡方 | 卡方 | Eta系数 |
定序 | Spearman | Spearman | |
定距 | Pearson |
0. 基本概念
相关的定义:
关系强度定义:
定类变量:根据定性的原则区分各类别的变量
特点:
举例:性别、民族、婚姻状况
定序变量:等级次序
特点:
举例:文化程度、工厂规模、年龄大小
定距变量:区别同一类别中等级次序及其距离的变量
特点:
- 能定量分析
- 零点没有意义
- 无法做乘除,只能做加减
举例:温度、比率、智力水平
定比变量:区别同一类别中等级次序及其距离的变量
特点:
- 零点有概念
- 可以做乘除
收入、价格、市场占有率
1. 卡方检测
2. Eta系数
3. Pearson系数
(1) 适用条件
- 定距变量、定比变量
- 两变量的总体应服从正态分布,或接近正态的单峰对称分布
- 两变量间为线性关系
- 变量必须是成对的数据
- 两变量是连续变量
- 数据个数一般大于30对
(2) 系数公式
r = ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = 1 n ( x i − x ˉ ) ∑ i = 1 n ( y i − y ˉ ) r= \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n(x_i-\bar{x})\sum_{i=1}^n(y_i-\bar{y})}} r=∑i=1n(xi−xˉ)∑i=1n(yi−yˉ)∑i=1n(xi−xˉ)(yi−yˉ)
r>0,正相关
r<0,负相关
r绝对值 | 相关程度 |
---|---|
0 ~0.19 | 极低相关 |
0.2~0.39 | 低度相关 |
0.4~0.69 | 中度相关 |
0.7~0.89 | 高度相关 |
0.9~1 | 极高相关 |
(3) t检验
检验是否存在偶然性
t
=
r
1
−
r
2
n
−
2
t= \frac{r}{\sqrt{1-\frac{r^2}{n-2}}}
t=1−n−2r2r
4. Spearman等级相关系数
(1) 适用情况
度量定序变量之间的关系
(2) 计算
r s = 1 − 6 ∑ ( x i − y i ) 2 n ( n 2 − 1 ) r_s = 1-\frac{6\sum(x_i-y_i)^2}{n(n^2-1)} rs=1−n(n2−1)6∑(xi−yi)2
计算前先从小到大排序
(3) t 检验
当n>20时,再进行t检验
t = r s n − 2 1 − r s 2 t = r_s\sqrt{\frac{n-2}{1-r_s^2}} t=rs1−rs2n−2
- ∣ t ∣ > t a 2 |t|>t_{\frac{a}{2}} ∣t∣>t2a,表明 r r r统计显著
- ∣ t ∣ ≤ t a 2 |t|\le t_{\frac{a}{2}} ∣t∣≤t2a,表明 r r r统计不显著,存在偶然性误差
5. *Kendall-tua-b 等级相关系数
适用于度量定序变量间的线性关系