卡方列联表的独立性检验

1.列联表是按两个或多个特征分类的频数数据,一般以表格形式组成。
2.判断两个或多个属性之间有无关联,即判别属性之间是否独立。
3.检验步骤

  1. 建立原假设
    H0: 两属性相互独立
    H1: 两属性之间不独立

  2. 计算自由度
    在这里插入图片描述

  3. 计算卡方统计量
    在这里插入图片描述

  4. 拒绝域
    在这里插入图片描述

  5. 对照卡方分布的临界值表,找到对应的卡方值,判断是否在拒绝域内

  6. 列联表独立性检验的python实现

'''
(1)假设检验重要知识
H0:A与B相互独立  H1:A与B不相互独立
若卡方值大于临界值,拒绝原假设,表示A与B不相互独立,A与B相关
函数中re返回为1表示拒绝原假设,0表示接受原假设

(2)参数说明
输入:
alpha --- 置信度,用来确定临界值
data  --- 数据,请使用numpy.array数组
输出:
g     --- 卡方值,也就是统计量
p     --- P值(统计学名词),与置信度对比,也可进行假设检验,P值小于置信度,即可拒绝原假设
dof   --- 自由度
re    --- 判读变量,1表示拒绝原假设,0表示接受原假设
expctd--- 原数据数组同维度的对应理论值

(3)应用场景
要求样本含量应大于40且每个格子中的理论频数不应小于5

理论知识详见博客:
'''
# 卡方独立性检验
import numpy as np
from scipy.stats import chi2_contingency
from scipy.stats import chi2

def chi2_independence(alpha, data):
    g, p, dof, expctd = chi2_contingency(data)

    if dof == 0:
        print('自由度应该大于等于1')
    elif dof == 1:
        cv = chi2.isf(alpha * 0.5, dof)
    else:
        cv = chi2.isf(alpha * 0.5, dof-1)


    if g > cv:
        re = 1  # 表示拒绝原假设
    else:
        re = 0  # 表示接受原假设

    return g, p, dof, re, expctd

实例测试

# test
alpha1 = 0.05  # 置信度,常用0.01,0.05,用于确定拒绝域的临界值
data1 = np.array([[367, 342,266,329], [56,40,20,16]])

g, p, dof, re, expctd = chi2_independence(alpha1, data1)

输出结果:
在这里插入图片描述
其中:p值为0.0002, re=1为拒绝原假设,表示两属性之间有关联

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在SPSS中进行列联表独立性检验有几种方法。其中之一是使用分层χ2检验。这种检验方法将研究对象分解成不同层次,然后按照各层对象来进行行变量与列变量的独立性研究。SPSS的统计分析菜单中提供了Cochran’s和Mantel-Haenszel统计量来自动给出结果。 进行列联表独立性检验后,我们需要根据统计量观测值和临界值的比较结果来做出结论和决策。如果卡方统计量的观测值大于卡方临界值,则可以拒绝原假设,即认为实际分布与期望分布之间的差距显著,行列变量之间存在相关关系。另外,我们还可以根据统计量观测值的概率P值和显著性水平α的比较结果来做出决策。如果P值小于等于α,则可以拒绝原假设,认为行列变量之间存在相关关系。 在SPSS中,还有其他一些功能和选项可以用于列联表独立性检验,比如卡方检验、Fisher检验和McNemar检验。此外,还可以计算期望和残差,包括皮尔逊残差、标准化残差和调整的标准化残差。对于缺失值,可以将其视为一种有效值进行处理。同时,还可以对行和列标题进行标注,并生成SAS或SPSS风格的输出。 综上所述,SPSS提供了多种方法和选项来进行列联表独立性检验,可以根据具体情况选择适合的方法和进行相应的统计分析。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [SPSS——描述性统计分析——列联表](https://blog.csdn.net/liuyuan_jq/article/details/51835149)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [【SPSS】列联表分析详细操作教程(附案例实战)](https://blog.csdn.net/m0_64336780/article/details/128920454)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [R语言列联表](https://download.csdn.net/download/weixin_38686924/14885224)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值