卡方检验简单笔记
一种计数资料的假设检验方法
1.独立性检验
如下表,判断喝牛奶对是否感冒有没有影响(喝牛奶与否、感冒与否是不是两个独立的事件)。
感冒人数 | 未感冒人数 | |
---|---|---|
喝牛奶组 | 43 | 96 |
不喝牛奶组 | 28 | 84 |
R语言:
chisq.test 函数,输出卡方值、自由度、p值
> tableTest <- matrix(c(43,96,28,84),nrow=2,ncol=2)
> chisq.test(tableTest)
Pearson's Chi-squared test with Yates' continuity correction
data: tableTest
X-squared = 0.80438, df = 1, p-value = 0.3698
python:
scipy.stats.chi2_contingency 返回一个元组,里面分别是卡方值、p值、自由度df、理论值数组
>>> from scipy.stats import chi2_contingency
>>> import numpy as np
>>> kf_data = np.array([[37,27], [39,21]])
>>> kf = chi2_contingency(kf_data)
>>> kf
(0.80437744748