这篇文章主要讲了两个部分,一个是卡方检验的推导,一个是卡方检验应该取多少样本量。
卡方独立性检验是为了检验两个变量是否独立,我们先来回顾一下卡方独立性检验的流程:
1、统计列联表,计算观察值:
![3c916518a7d90db4f96e8e39b17f2842.png](https://img-blog.csdnimg.cn/img_convert/3c916518a7d90db4f96e8e39b17f2842.png)
图中的数字都是频数,例如男士分期的频数为80,女士分期的频数是20。图中的频数90,110,30,70这些是我们的观察值,为别用
2、做出假设,计算期望值:
我们的假设是性别跟是否分期是独立的,所以我们的期望值应该是如下图所示:
![60a135f96a6b27e655733a139d20b62e.png](https://img-blog.csdnimg.cn/img_convert/60a135f96a6b27e655733a139d20b62e.png)
图中的期望值80,120,40,80我们用
3、计算卡方统计量
卡方统计量
经过查表,我们可以算出p值为0.012,在0.05的阈值下,我们认为观察到的情况是(表一)小概率时间,所以拒绝了性别跟是否分期是独立的的原假设。