患者 | 健康 | ||
吸烟 | 28 | 72 | 100 |
不吸烟 | 54 | 56 | 100 |
82 | 128 | 200 |
要算理论频数,要先求理论概率。这里你一共有200人,其中患病的有82人,不患病的有128人,那么患病理论概率是82/200,不患病的理论概率是128/200.
然后,你把这200人分成了两组,吸烟和不吸烟。吸烟这组有100人,那么按理论概率计算,这100人里面,患病的人应该是100*(82/200)。这样就算出了吸烟并且患病的理论频数啦。
同理,吸烟不患病应该是100*(128/200)。其余都同理啦。
理论频数T11=82*100/200=41; T12=128*100/200=64 以此类推
下面是适用于四格表应用条件:
随机样本数据。两个独立样本比较可以分以下3种情况:
(1) 总样本量 n≥40,所有理论频数 T≥5 时,用Pearson卡方检验或似然比χ2 检验,他们结论基本一致。
(2) 总样本量 n≥40,但有理论频数 1≤T<5时,用连续性校正卡方(χ2)检验。
(3) 总样本量 n<40,或有理论频数 T<1时,不能用卡方检验,用Fisher 精确概率法检验。