这篇文章主要讲了两个部分,一个是卡方检验的推导,一个是卡方检验应该取多少样本量。
卡方独立性检验是为了检验两个变量是否独立,我们先来回顾一下卡方独立性检验的流程:
1、统计列联表,计算观察值:
![7ed71ce265fc9063f4a6e1286dd66ee1.png](https://img-blog.csdnimg.cn/img_convert/7ed71ce265fc9063f4a6e1286dd66ee1.png)
图中的数字都是频数,例如男士分期的频数为80,女士分期的频数是20。图中的频数90,110,30,70这些是我们的观察值,为别用
2、做出假设,计算期望值:
我们的假设是性别跟是否分期是独立的,所以我们的期望值应该是如下图所示:
![c3006eaa67ffcbf6ab2f7993133d8d85.png](https://img-blog.csdnimg.cn/img_convert/c3006eaa67ffcbf6ab2f7993133d8d85.png)
图中的期望值80,120,40,80我们用
3、计算卡方统计量
卡方统计量
经过查表,我们可以算出p值为0.012,在0.05的阈值下,我们认为观察到的情况是(表一)小概率时间,所以拒绝了性别跟是否分期是独立的的原假设。