卡方检验vs费希尔精确检验vs分层卡方检验
一、独立性检验
1.卡方独立检验
卡方检验的p值越小,说明K值越大,即 χ 2 \chi^2 χ2 的值越大,说明“X与Y有关系”成立的可能性越大。
library(vcd)
mytable <- table(Arthritis$Treatment,Arthritis$Improved)
chisq.test(mytable)
fisher.test(mytable)
卡方检验p值<0.005
拒绝原假设
说明treatment与improved这两个变量不独立,存在相关性
mytable <-table(Arthritis$Improved,Arthritis$Sex)
chisq.test(mytable)
fisher.test(mytable)
卡方检验p值大于0.005,说明独立
2.费希尔精确检验
类似上面,P值越小,说明相关性越大,用四象限法算一下就明白为什么了
library(vcd)
mytable <- table(Arthritis$Treatment,Arthritis$Improved)
fisher.test(mytable)
费歇尔检验p值<0.005,说明存在相关性
mytable <-table(Arthritis$Improved,Arthritis$Sex)
fisher.test(mytable)
费歇尔检验p值>0.005,说明独立
3.分层卡法检验(CMH)
分层卡方检验,也称为Cochran-Mantel-Haenszel检验(CMH检验),它主要用于上述的分层分析中,也就是在研究暴露/处理因素和结局事件关联性的基础上,考虑了分层因素的混杂作用。
CMH检验通过对分层因素进行控制,从而考察调整之后暴露/处理因素与结局事件之间的关联性。实际上CMH检验,已经不再是单纯的单因素分析,而是已经开始融入了多因素分析的思维模式,应该算作为一种最为简单的多因素分析方法。
mytable <- xtabs(~Treatment+Improved+Sex, data=Arthritis)
mantelhaen.test(mytable)