给我的科研朋友们来杯mojito——冬天的第一堂统计课
今天给大家带来第六期刘岭教授的统计说说—卡方检验的具体应用。
好,闲话不多说,开课了。
在上一讲我们谈到“针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及到这一种或几种方法)”,今天我们就来说一说这个卡方(χ2)检验。
χ2检验是反应变量和分组变量都为二分类变量或多分类(无序)变量时,分析两变量间关系的方法。
理论基础:χ2检验是以χ2分布为理论依据,用于判断样本的实际频数分布与某种假设或理想的频数分布是否相符的一种差异性检验方法,广泛应用于计数资料的统计分析。概括地说,χ2检验用于推断两个或两个以上分类变量间的独立性,主要用于检验率或构成比之间差异的显著性,以及两事物之间关联的显著性。(有点啰嗦,可略过)。
这一讲我们针对反应变量和分组变量都为二分类变量(即为四格表)的χ2检验。
一一
独立样本比较的卡方检验
对四格表资料而言,其检验目的是推断两个总体的率是否不等。完全随机设计四格表资料的χ2检验的应用条件是:①当样本总例数N≥40,所有理论频数T>5时,计算Pearson χ2值(SPSS软件结果看第一行);②当样本总例数N≥40,有一个理论频数1<T<5时,须对Pearson χ2值进行连续性校正(SPSS软件结果看第二行);③当样本总例数N<40,或有一个理论频数T<1时,须计算Fisher确切概率进行检验(SPSS软件结果看第四行)。
例1:某医生用肝炎灵注射液和常规疗法治疗慢性乙型肝炎,资料见表1所示。试问两组疗效间有无显著性差别?
案例分析思考:
1.研究目的:分析肝炎灵注射液治疗慢性乙型肝炎是否比常规疗法好;
2.研究设计类型:完全随机设计两组比较(肝炎灵注射液组和常规疗法组),样本量不等;此类设计可以样本量不等(但最好不要相差太过悬殊了);又称独立样本比较或两样本比较;
3.反应变量:疗效属于计数资料(二分类:有效和无效);分组变量也属于计数资料(二分类:肝炎灵注射液和常规疗法),形成的交叉表也称四格表(表1红框)
4. χ2检验的应用条件。
具