独立样本t检验主要用来统计两组数据的均值是否有差异性。具体定义如下:独立样本T检验用于分析定量数据(X)与定类数据(Y)之间的差异情况。独立样本T检验除了需要服从正态分布、还要求两组样本的总体方差相等。当数据不服从正态分布或方差不齐时,则考虑使用非参数检验。举例说明,如下图所示,X代表收入,Y代表男女,0代表女,1代表男,现要统计男女之间的平均工资是否有差异性,可以用独立样本t检验。

男女两样本均值差异性的t统计量公式如下:


测试代码:
from scipy import stats
import numpy as np
np.random.seed(123)
rvs1 = stats.norm.rvs(loc=5,scale=10,size=100)
rvs2 = stats.norm.rvs(loc=5,scale=10,size=100)
#当两总体方差相等时,即具有“方差齐性”,可以直接检验#p-value>0.05不拒绝原假设——两总体均值相等print(stats.ttest_ind(rvs1,rvs2))