整理自此文:https://www.jianshu.com/p/807b2c2bfd9b
1.卡方检验:检验两个变量之间有没有关系
以运营为例:
- 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;
- 不同城市级别的消费者对买SUV车有没有什么区别;
如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。
2. 以投硬币为例
1) 根据投硬币观察到的正面,反面次数,判断这个硬币是均衡的还是不均衡。
现在有一个正常的硬币,我给你投50次,你觉得会出现几个正面,几个反面?
而卡方检验是拿观察到的现象(投正面或反面的次数或者频数),来判断这个结果(硬币是不是均衡的)。
上面这个例子,
如果我不知道这个硬币是不是均衡的,我想用正面,反面的频次来判断,我投了50次,
其中28个正面,22个反面。我怎么用卡方检验来证明这个硬币是均衡的还是不均衡的呢?
卡方检验的公式:
这个公式可以帮我们求出卡方检验的值,我们用
- 1 这个公式求得的值
- 2 自由度(degree of freedom,推荐这个作者的:用可视化思维解读统计自由度,解释得很好)
- 3 置信度
其中,自由度我们可以求出来,置信度的话,我们按照我们自己意愿挑选,一般我们会挑90%或者95%。
计算如下:
我们拿到这3个信息,去查表,因为0.72小于查表得到的3.841,所以我们得出这个硬币是均衡的结论。
【注】如果你们查表后,还是不知道是该大于的时候说均衡,还是小于的时候说均衡,那么你们可以想一下具体这个例子,
如果硬币是均衡的话,你觉得卡方的值是越小越可能是均衡的,还是越大越可能是均衡的呢?
3. 更复杂--掷骰子
4. 电商运营中消费者的性别和购买生鲜的关联
此处不再整理,详情看参考文章:https://www.jianshu.com/p/807b2c2bfd9b
自由度讲解文章:https://www.jianshu.com/p/0032087b9dbb