独立样本t检验主要用来统计两组数据的均值是否有差异性。具体定义如下:独立样本T检验用于分析定量数据(X)与定类数据(Y)之间的差异情况。独立样本T检验除了需要服从正态分布、还要求两组样本的总体方差相等。当数据不服从正态分布或方差不齐时,则考虑使用非参数检验。举例说明,如下图所示,X代表收入,Y代表男女,0代表女,1代表男,现要统计男女之间的平均工资是否有差异性,可以用独立样本t检验。
![](https://img-blog.csdnimg.cn/img_convert/f9b9457318947907134c842241ffc68f.png)
男女两样本均值差异性的t统计量公式如下:
![](https://img-blog.csdnimg.cn/img_convert/d1ec6afcce2ef609300c4f7fe56f0cbc.png)
![](https://img-blog.csdnimg.cn/img_convert/0337a7330ea03b3ec3a7aac356f09e3a.png)
测试代码:
from scipy import stats
import numpy as np
np.random.seed(123)
rvs1 = stats.norm.rvs(loc=5,scale=10,size=100)
rvs2 = stats.norm.rvs(loc=5,scale=10,size=100)
#当两总体方差相等时,即具有“方差齐性”,可以直接检验#p-value>0.05不拒绝原假设——两总体均值相等print(stats.ttest_ind(rvs1,rvs2))