关于假设检验
假设检验(Hypothesis Testing),或者叫做显著性检验(Significance Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。既然以假设为前提,那么在进行检验前需要提出相应的假设:
H0:原假设或零假设(null hypothesis),即需要去验证的假设;一般首先认定原假设是正确的,然后根据显著性水平选择是接受还是拒绝原假设。
H1:备择假设(alternative hypothesis),一般是原假设的否命题;当原假设被拒绝时,默认接受备择假设。
如原假设是假设总体均值μ=μ0,则备择假设为总体均值μ≠μ0,检验的过程就是计算相应的统计量和显著性概率,来验证原假设应该被接受还是拒绝。
卡方检验
卡方检验(chi-square test),也就是χ2检验,用来验证两个总体间某个比率之间是否存在显著性差异。卡方检验属于非参数假设检验,适用于布尔型或二项分布数据。
下面用例子来说明卡方检验的过程:
例:某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如下表,问两种疗法有无差别?
步骤1:建立检验假设
(即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。)
H0:两种疗法的有效率相等,即n1=n2=60.9
H1:两种疗法的有效率不相等
α=0.05,α为置信水平
步骤2:计算理论数
其中TRC表示第R行C列格子的理论数,nR为R行的合计数,nC为C列的合计数,n为总例数。
第1行1列: 43×53/87=26.2
第1行2列: 43×34/87=16.8
也可由43-26.2=16.8求得
第2行1列: 44×53/87=26.8
第2行2列: 44×34/87=17.2
也可由44-26.8=17.2求得
步骤3:计算χ2值
其中A为实际值,T为理论值。
则有:
步骤四:根据χ2值表求p值(置信水平)
首先计算自由度V=(行数-1)×(列数-1)=1;
χ2部分界值表如下:
由上表可知
10.83>χ2>6.63,则p<0.01<α,那么拒绝H0,接受H1,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。