卡方检验研究X和Y的差异,X和Y均是类别数据。当前需要进一步考虑另一个干扰因素分层项。比如是否吸烟(X)与是否生病(Y)的关系时,将性别纳入考虑范畴(即混杂因素,分层项Factor)。此时则称为分层卡方,分层卡方也称为Cochran-Mantel-Haenszel检验(CMH检验),分层卡方可以很好的解决‘辛普森悖论’问题。SPSSAU支持2*2*K结构数据(即X和Y均为2分类,K层)。
一、理论说明
分层卡方是在卡方检验基础上,进一步考虑分层项的干扰(混杂因素),通常分析时需要对于混杂因素(分层项)有一定的预知(或文献参考),然后再进行分层卡方检验。
- 针对分层卡方,其涉及以下理论知识内容,如下表格:
通常情况下,首先查看‘比值比齐性检验’,如果其呈现出显著性(p 值小于0.05),则说明具有混杂因素,即需要考虑分层项,即分别查看不同分层项下的数据结果。反之如果没有通过‘比值比齐性检验’,即说明没有混杂因素不需要考虑分层项,报告整体的结果即可(包括卡方检验,以及OR值)。 Cochran–Mantel–Haenszel条件独立性用于研究考虑混杂因素(分层项)后,X与Y之间是否还存在着差异关系,相对意义较小。
二、分层卡方案例
1、背景
当前有一项关于是否吸烟对于感冒发生风险的影响,共有1046名研究对象,并且记录是否感冒,是否吸烟,以及性别信息。
2、数据说明
原始数据(模拟数据)如下:
原始数据使用加权格式。
- 是否吸烟时,数字1表示‘吸烟’,数字2表示‘不吸烟’;
- 是否感冒,数字1表示‘感冒’,数字2表示‘无感冒’。
- 分层项性别时,数字1表示‘男’,数字2表示‘女’,数字3表示‘保密’。
- 加权项weight表示各研究对象类别组合的数量,比如465表示,吸烟且感冒且为男性的数量。
- 提示:
- 针对分层卡方,SPSSAU支持2*2*k结构,即X和Y均为2个类别,如上述中的是否吸烟和是否感冒,k表示分层项的类别数量,(案例中性别分为‘男’,‘女’和‘保密’,则为3层)。
3、操作步骤
本案例使用加权数据格式,放置分析项情况操作如下:
使用路径:SPSSAU→实验/医学研究→分层卡方
4、SPSSAU输出结果
SPSSAU共输出5类表格,如下说明:
表格 | 说明 |
Cochran-Mantel-Haenszel test基本说明 | 分析项的基本汇总。 |
分层卡方检验汇总表格 | √ 展示各层及不分层时,X与Y的卡方检验;√ 使用fisher卡方检验,且展示OR值和95%区间。 |
Mantel-Haenszel Common比值比OR值估计 | 展示Mantel-Haenszel Common比值比OR值,以及OR值的对数值,并且展示95%区间。 |
比值比齐性检验(Breslow-Day-Tarone) | 展示Breslow-Day比值比齐性检验。 |
Cochran–Mantel–Haenszel条件独立性检验 | 展示chran–Mantel–Haenszel条件独立性检验。 |
①分层卡方检验汇总表格
上表格展示各个分层(以及不分层)情况下时,各交叉类别项的数据情况,以及输出OR值和fisher卡方值,比如不分层时,即完全不考虑性别时,‘是否吸烟’与‘是否感冒’之间呈现出显著性(χ2=15.136, p =0.000<0.01),OR值为2.077,即说明整体上吸烟是个风险因素,且吸烟时危险度是不吸烟的2.077倍。但是分层考虑时,仅男性时呈现出显著性(χ2=5.514, p =0.024<0.05),而女性和保密两类群体时并没有呈现出显著性( p > 0.05)。也即说明可能需要考虑混杂因素的存在(即分层项存在),接着下面将进行对应的分层项相关检验和说明。
②Mantel-Haenszel Common比值比OR值估计
- 提示:
- 此处95%置信区间的计算是假定OR值=1进行计算。
上表格展示Mantel-Haenszel Common比值比OR值,OR值为1.772,即说明整体上吸烟是个风险因素,且吸烟时危险度是不吸烟的1.772倍(95% CI: 1.1760 ~ 2.6701)。
③比值比齐性检验结果
上表格展示比值比齐性检验,默认使用Breslow-Day法进行检验,上表格显示并没有通过比值比齐性检验(χ2=1.089, p=0. 5801>0.1),即意味着各层之间同质,并不存在混杂作用,即不存在混杂因素(性别),即并不需要分别报告各层对应的值(比如OR值),整体报告即可,此处可报告整体的Mantel-Haenszel Common比值比OR值即1.772。
SPSSAU自动输出智能分析结果:
④Cochran–Mantel–Haenszel条件独立性检验
上表格展示条件独立性结果,Mantel-Haenszel Common法拒绝原假设(χ2=7.0547, p=0. 0079<0.01),也即说明控制混杂干扰因素(性别)之后,吸烟和感冒之间依旧存在着显著性差异,而且OR值为1.772,即吸烟是个风险因素,且吸烟时危险度是不吸烟的1.772倍。
5、关键点剖析
① 分层卡方时,SPSSAU支持加权和不加权两种格式,通常使用加权格式,分析时下拉选择‘加权项’即可。
② 比值比齐性检验研究是否存在着混杂因素(即分层项的存在是否具有意义)。
③ Mantel-Haenszel Common比值比OR值,与单独进行卡方检验时整体OR值并不一致,Mantel-Haenszel Common比值比OR值可理解为校正OR值,但二者意义一致。