两变量之间的相关性分析

定类定序定距
定类卡方卡方Eta系数
定序SpearmanSpearman
定距Pearson

0. 基本概念

相关的定义:

关系强度定义:

定类变量:根据定性的原则区分各类别的变量
特点:
举例:性别、民族、婚姻状况

定序变量:等级次序
特点:
举例:文化程度、工厂规模、年龄大小

定距变量:区别同一类别中等级次序及其距离的变量
特点:

  • 能定量分析
  • 零点没有意义
  • 无法做乘除,只能做加减
    举例:温度、比率、智力水平

定比变量:区别同一类别中等级次序及其距离的变量
特点:

  • 零点有概念
  • 可以做乘除
    收入、价格、市场占有率

1. 卡方检测

2. Eta系数

3. Pearson系数

(1) 适用条件

  • 定距变量、定比变量
  • 两变量的总体应服从正态分布,或接近正态的单峰对称分布
  • 两变量间为线性关系
  • 变量必须是成对的数据
  • 两变量是连续变量
  • 数据个数一般大于30对

(2) 系数公式

r = ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) ∑ i = 1 n ( x i − x ˉ ) ∑ i = 1 n ( y i − y ˉ ) r= \frac{\sum_{i=1}^n(x_i-\bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^n(x_i-\bar{x})\sum_{i=1}^n(y_i-\bar{y})}} r=i=1n(xixˉ)i=1n(yiyˉ) i=1n(xixˉ)(yiyˉ)

r>0,正相关
r<0,负相关

r绝对值相关程度
0 ~0.19极低相关
0.2~0.39低度相关
0.4~0.69中度相关
0.7~0.89高度相关
0.9~1极高相关

(3) t检验

检验是否存在偶然性
t = r 1 − r 2 n − 2 t= \frac{r}{\sqrt{1-\frac{r^2}{n-2}}} t=1n2r2 r

4. Spearman等级相关系数

(1) 适用情况

度量定序变量之间的关系

(2) 计算

r s = 1 − 6 ∑ ( x i − y i ) 2 n ( n 2 − 1 ) r_s = 1-\frac{6\sum(x_i-y_i)^2}{n(n^2-1)} rs=1n(n21)6(xiyi)2

计算前先从小到大排序

(3) t 检验

当n>20时,再进行t检验

t = r s n − 2 1 − r s 2 t = r_s\sqrt{\frac{n-2}{1-r_s^2}} t=rs1rs2n2

  • ∣ t ∣ > t a 2 |t|>t_{\frac{a}{2}} t>t2a,表明 r r r统计显著
  • ∣ t ∣ ≤ t a 2 |t|\le t_{\frac{a}{2}} tt2a,表明 r r r统计不显著,存在偶然性误差

5. *Kendall-tua-b 等级相关系数

适用于度量定序变量间的线性关系

  • 2
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值