转自https://blog.csdn.net/ludan_xia/article/details/81737669
卡方检验
卡方检验是一种用途很广的计数资料的假设检验方法。属于非参数检验,主要是比较两个及两个以上样本率(构成比)以及两个分类变量的关联性分析。根本思想在于比较理论频数和实际频数的吻合程度或者拟合优度问题。
应用:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析。
举例一:想知道喝牛奶对感冒发病率有没有影响。
喝牛奶组和不喝牛奶组的感冒率为30.94%和25.00%,两者的差别可能是抽样误差导致,,也可能是 牛奶对感冒率真的有 影响。
下面就就行假设了:假设喝牛奶对感冒发病率没有影响,即喝牛奶与感冒无关
所以感冒的发病率实际是(43+28)/(43+28+96+84)=28.29%
所以可以得到理论的表格
如果说真的没有影响的话 表格中理论值和实际值差别应该会很小。
卡方检验的计算公式
其中:A是实际值,T为理论值
X^2值的意义:衡量理论与实际的差异程度。
经过计算可以计算得到
X^2=1.077
下面就是我们如何根据卡方值来判断是否有差异了。
我们需要查询卡纸分布的临界值,将计算的值与临界值比较。
查询临界值就需要知道自由度
自由度V=(行数-1)*(列数-1);
对于该问题V=1,查询可得 临界值为3.84
如果x^2 <临界值 则假设成立。。
参考博客
http://blog.sina.com.cn/s/blog_7054a1960102wizu.html
https://blog.csdn.net/qq_15111861/article/details/80723754