先用一个例子解释卡方。
一个硬币,正面是字,反面是花。抛20次,有11次是字,9次是花。根据这个抛出结果,可否假设抛一次硬币出现字和花的概率都是50%?验证这个假设,就是卡方检验。
期望次数:假如认为子和花出现概率都是50%抛出的理论次数。本例中,抛20次,如果字和花出现的概率相同,那么它们的期望次数都10。
我们可以把观察次数和期望次数放到下表。
观察次数 | 期望次数 | 合计 | |
字 | 11 | 10 | 21 |
花 | 9 | 10 | 19 |
合计 | 20 | 20 | 40 |
从直觉来说,如果观察次数和期望次数是一样的,假设是合理的。如果观察次数和期望次数差别比较大,则假设是不合理的。由此,设计一个衡量观察次数和期望次数之间差异的值。又考虑到,如果抛硬币次数不是10,是100次,