卡方检验作为一种常见的假设检验,在统计学中的地位是显而易见的,如果你还不太清楚可以参看这篇博文:卡方检验用于特征选择,写的非常的浅显易懂,如果你还想再扩展点卡方检验方面的知识,可以参看这篇博文卡方检验基础,写的也很有意思。前辈的功底都很深厚,小弟就就不再阐述卡方检验的原理、意义及如何计算了,理解了其实很简单就那么个公式,再根据实际业务场景关键看你选择哪一个。从chi-squared value 到p-value,相信大多数同学和我一样,查表,因为大学课本上就是这么写的。假如在实际业务场景中,自由度和显著性水准都不确定的情况下,怎么办呢?查表就显得不那么地道了。
这时可能很多同学想到了著名的fisher精确检验,因为这个检验能直接求出的精确的p-value,但是在检验数据样本比较大的情况下,fisher精确检验的计算复杂度会让你显得那么的力不从心,本系列的后面将会讲到fisher精确检验的原理并给出其源码及与chi-squared的效率对比。还是抓紧时间侃侃怎么通过chi-squared计算p-value吧,估计心急的同学就等不及了。ok,咱们攻城师还是用代码说话,先上代码: