什么是卡方分析web
卡方分析有两个常见的应用——适合度分析和独立性分析。这个笔记着重于适合度分析。从我目前的经验来看,这也是应用十分普遍的一种统计分析方式。那么什么是卡方适合度分析呢?且听我慢慢道来。svg
现象1 现象2 现象3
观测值 a b c
预期值 A B C
常见的适合度分析的结构以下,通常有两组数据,一组是你统计或者观察到的值,另外一组是理论上的预期值。若是这两组值十分接近,证实观测到的结果很“合适”,若是差距较大,则证实观测到的数据不够“合适”,这就是“适合度分析”名字的含义。函数
这种统计分析在科学研究中是十分经常使用的,由于科学家常常按照理论预期来推测试验结果,而实际上因为各类偏差的存在,实验数据不可能和理论预期彻底一致,这时卡方检验就能很好地检验理论的正确性。测试
举个栗子ui
某科学家预言抛一个色子,各面向上的概率都相同。为了验证本身理论的正确性,该科学家抛了600次硬币,结果为一点102次,二点102次,三点96次,四点105次,五点95次,六点100次。显然这个结果和理论预期并不彻底同样,那么,科学家的理论有错吗?咱们就用Python来验证一下。spa
from scipy import stats
obs = [102, 102, 96, 105, 95, 100]
exp = [100, 100, 100, 100, 100, 100]
stats.chisquare(obs, f_exp = exp)
输出
(0.73999999999999999, 0.980