sql联表分类统计_数据统计的理解和运用(四)列联表之卡方检验

本文详细介绍了非参数检验中的卡方检验,包括其基本思想、适用条件和不同场景下的应用,如四格表和R×C表的统计分析。通过举例和软件操作(SAS、R语言、SPSS)展示了如何进行卡方检验,以判断观察值与期望值之间的差异是否具有统计学意义。
摘要由CSDN通过智能技术生成

fb13979fa012323f91c844c8305ebb51.png

前面几期我们介绍了参数检验,t检验和方差分析:

临度科研:数据统计的理解和运用(三)方差分析​zhuanlan.zhihu.com
27e743b3945ed1ef8b27a89b71b30219.png
临度科研:数据统计的理解和运用(二)t检验的应用​zhuanlan.zhihu.com
27e743b3945ed1ef8b27a89b71b30219.png

今天我们来介绍非参数检验——迷人的卡方检验(Chi-square test/Chi-Square Goodness-of-Fit Test)。

卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

卡方检验是以 χ2 分布为基础的一种常用假设检验方法,它的假设检验为:

H0:观察频数与期望频数没有差别。H1:观察频数与期望频数有差别。

卡方检验的基本思想是:首先假设 H0 成立,基于此前提计算出 χ2 值,它表示观察值与理论值之间的偏离程度。根据 χ2 分布及自由度可以确定在H0 假设成立的情况下获得当前统计量及更极端情况的概率P。

如果 P 值很小,说明观察值与理论值偏离程度太大,应当拒绝无效假设,表示比较资料之间有显著差异;否则就不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。

适用于四格表应用条件:

两个独立样本比较可以分以下3种情况:(1) 所有的理论数 T≥5 并且总样本量 n≥40,用 Pearson 卡方进行检验。(2) 如果理论数 T<5 但 T≥1,并且 n≥40,用连续性校正的卡方进行检验。(3) 如果有理论数 T<1 或 n<40,则用 Fisher’s 检验。

R×C表卡方检验应用条件:

(1) R×C表中理论数小于5的格子不能超过1/5;(2) 不能有小于1的理论数;不满足 (1) 或 (2) 时,均采用 Fisher’s 检验。如果实验中有不符合R×C表的卡方检验,可以通过增加样本数、列合并来实现。

列联表的资料大致分为以下 10 类:

  1. 成组设计横断面研究四格表资料统计分析
  2. 成组设计队列研究四格表资料统计分析
  3. 成组设计病例对照研究四格表资料统计分析
  4. 成组设计结果变量为多值有序变量的2XC表资料统计分析
  5. 成组设计结果变量为多值名义变量的2XC表资料统计分析
  6. 单因素多水平设计有序原因变量RX2表资料统计分析
  7. 单因素多水平设计双向无序RXC表资料统计分析
  8. 单因素多水平设计无序原因变量RX2表资料统计分析
  9. 单因素多水平设计有序结果变量RXC表资料统计分析
  10. 单因素多水平设计双向有序RXC表资料统计分析

由于篇幅限制,因此本次仅讲解两条(感兴趣的读者可以先关注我们,我们后续推出精彩讲解),也是常见的两类&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值