我们使用下面的一个简单的例子来熟悉Student t检验的方法。
在10块地上同时种植甲乙两种作物,其产量服从正态分布,并且方差相同。结果计算得 x⎯⎯=30.97,y⎯⎯=21.79,Sx=26.7,Sy=12.1 。试问这两种作物的产量有无明显差异?
这是一个典型的双样本,正态同方差的假设检验,判断两个正态分布的期望是否相同。 H0:μ1=μ2,H1:μ1≠μ2 。
使用scipy直接做假设检验
Scipy提供了两个方法解决双样本同方差的Student t-test问题:
1. scipy.stats.ttest_ind
2. scipy.stats.ttest_ind_from_stats
第一个方法要求输入原始样本数据,第二个方法直接输入样本的描述统计量(均值,标准差,样本数)即可。那么这里我们直接使用第二方法。
需要注意的是,Scipy.stats库函数要求输入的样本标准差是总体标准差的无偏统计量,也就是我们常说的“修正样本方差”和“修正样本标准差”。
S2=1nΣni=1(xi−x⎯⎯)