应用统计—第十章 卡方检验

卡方检验


我会用目录哩

应用情况

处理 一个因素的多项分类 / 多个因素 的实际观察频数和理论频数是否 相一致/有显著差异

应用条件

  • 计数数据&非参检验
  • 分类相互排斥,互不包容
  • 观测值相互独立
  • 每一格的理论次数<5时需矫正项

分类

  • 拟合优度检验(又称配合度检验、正态吻合性检验)
  • 独立性检验(用于判断多个因素(一般两个因素)的多项分类是否相互独立)
  • 同质性检验(用于判断样本是否来自同一总体)

名词解释

  • f0 : 实际频数分布
  • fe : 理论频数分布
  • X^2 : 卡方值
  • k : 分类数
  • n : 样本数
  • i : 变量
  • j : 变量的分类
  • fij : 第i行第j列(变量i的j类)的单元格数值
  • fxi : x变量的分类
  • fyi : y变量的分类

计算步骤

先提出假设(H1:fo =/ fe),计算卡方值(需计算fe),根据df查表,进行决策。

  1. 提出假设

    H0 : fo = fe,H1 : fo =/ fe

  2. 计算fe(根据不同类别的检验而不同)
  3. 计算卡方值

    X^2 = f0与fe之差的平方比上fe再求和

  4. 计算df(根据不同类别的检验而不同)
  5. 查表,决策

拟合优度检验中的fe与df

df

1.一般理论次数:df = k - 1 (分类项-1)
2.正态拟合理论次数:df = k - 3(分类项-3)

fe

1.无差假说:fe = n * 1/k(平分)
2.假设分布:fe = n * p(乘以对应概率)

独立性检验中的fe、df与卡方值

独立性检验顾名思义是研究独立性/关联性问题,即两因素y,x是否有关系
独立性检验一般可以表示为r*c列联表形式
(有时间补一个图示)
df(c:c因素分类数)

df = (c - 1) * (r - 1)

fe(fxi, fyi见名词解释)

fe = (fxi * fyi) / n

当两因素(独立)都只有两个分类,即构成2*2列联表时,卡方值有更简便的算法

x^2 = [n * (ad - bc)^2] / [ fx1 * fx2 * fy1 * fy2]
n乘以对角线乘积差的平方比边缘值之积

当两因素(相关)都只有两个分类,构成2*2列联表时,卡方值算法如下

x^2 = (a - d)^2 / (a + d) :差的平方比和

期望次数计算总结

期望次数共有三类情况:
拟合优度中无差检验:fe = k * 1/n
拟合优度中假设检验:fe = k * p
独立性检验:fe = (fxi * fyi) / n

校正方法

当期望次数/理论次数有某项<5时:
需要用校正公式计算卡方值

x^2 = (实际次数与理论次数差的绝对值-0.5)^2求和 / fe

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值