NLP相关学术内容:卡方检验

卡方检验
https://blog.csdn.net/snowdroptulip/article/details/78770088

卡方检验的的公式中,A为实际值T为理论值,x2用于衡量实际值和理论值的偏差程度。在我们算出来上述例子中卡方值之后,我们应该如何确定是否喝牛奶与感冒独立无关呢?答案是,通过查询卡方分布的临界值表。
自由度等于V = (行数 - 1) * (列数 - 1),对四格表,自由度V = 1。对V = 1,喝牛奶和感冒95%概率不相关的卡方分布的临界概率是:3.84。即如果卡方大于3.84,则认为喝牛奶和感冒有95%的概率不相关。显然1.077<3.84,没有达到卡方分布的临界值,所以喝牛奶和感冒独立不相关的假设不成立。

我们想知道吃晚饭和不吃晚饭是否对体重下降有影响,所以我们先认为他们彼此独立没有影响,这样的话,吃晚饭而且体重下降的人应该是(168/741)*590=133.765,以此类推算出所有的预测值。之后我们计算卡方值为5.498大于自由度1对应的界限值3.84,因此被拒绝,认为他们是相关的,而且程度很高。(a为显著性水平,默认0.05)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值