import scipy
一、卡方检验
卡方验证可以解决两组离散变量的相关性, 常用于建模中,研究某个字段是否对离散型的预测目标有影响,进行降维
chi2, p, dof = stats.chi2_contingency(两组数据array)
统计量 p值 自由度
二、T检验
t检验:
–用于对各变量系数显著性检验
–用于检查假设的期望和抽样的样本期望是否一致
–用于小样本
判断标准:一般用p值 0.05来衡量
小于0.05 显著
大于0.05不显著
2.1 单样本T检验-ttest_1samp
stats.ttest_1samp(要检验的样本数据,假设的期望值)
2.2 两独立样本t检验-ttest_ind
条件:(两组样本具有相同的方差, 如果方差不同需要将equal_val参数设定为“False”)
stats.ttest_ind(rvs1,rvs2)
2.3 配对样本t检验
检验 rvs1 与 rvs2 所代表的总体均值相等
stats.ttest_rel(rvs1,rvs2)
三、z检验
Z检验和t检验其实一样,都是对均值进行检验,但是不一样的地方在于Z检验要求样本量比较大,并且总体方差已知。由于t检验不要求总体方差已知,所以t检验的应用范围比较广。Z检验其实和t检验有相同的计算形式:
z, p = sw.ztest(arr, value=39)
四、F检验(联合假设检验)
检查两组数据的方差是否有显著差异(方差齐性)
stats.levene(rvs1, rvs2)