本文参考
卡方检验1 https://www.jianshu.com/p/807b2c2bfd9b
卡方检验2 https://www.cnblogs.com/wzdLY/p/9649101.html
卡方分布上侧分位数表 https://wenku.baidu.com/view/bd0b0816c281e53a5802ff63.html
0 什么是卡方检验
卡方检验主要用于分类变量之间的独立性检验,换言之,就是检验两个变量之间有没有关系。
例如,研究学历对收入的影响是否显著性;
男性或者女性对线上买生鲜食品有没有区别;
不同的治疗方法是否有明显效果。
基本思想是根据样本数据推断总体分布与期望分布是否有显著性差异,或者推断两个分类变量是否相关或者独立。
一般可以设原假设为 :观察频数与期望频数没有差异,或者两个变量相互独立不相关。
实际应用中,我们先假设原假设成立,计算出卡方值,卡方表示观察值与理论值间的偏离程度。
1 卡方值计算公式
- A是观察值,即真实统计值;
- E是理论值(期望频数),即假设两个变量不相关情况下的期望值。
例如,我们通过问卷调查的方式得到如下数据,展示了本科和研究生收入是否过万的人数。