案例:针对同一系列的教材,学校设计了两种不同的自助学习系统,现采集每种教学系统下学生完成全部教程所需要的时间。(案例摘自《商务与经济统计学》)
1、利用描述统计学方法汇总每种学习系统下学生学完教程的时间数据。根据样本资料,你能观察到有何相似之处和差异?
2、评价两种方法总体均值之间的差异,讨论你的结论?
3、计算每一种系统的标准差与方差,进行两种系统总体方差相等的假设检验,讨论你的结论。
4、关于两种方法之间的差异,你能得到什么结论?你有何建议?请作出解释。
5、对于将来要使用那种系统,在作出最终决定之前你是否还需要其他数据或者检验。
本文主要围绕解决第三个问题来讲解方差齐性检验。
1、方差齐性检验描述方差齐性检验方法
2、python实现方差齐性检验
方差齐性检验的检验统计量使用的是F分布,由于F分布对正态总体的假定是敏感的,只有当两个总体至少近似正态分布的假定是合理的,才能使用F分布。
本案例并未给出两总体的分布,所以我们需要先检验两总体是否服从正态分布。
2.1 检验两总体服从正态分布
data = pd.read_csv(r'/Training.csv')
data.columns=['旧系统完成时间','新系统完成时间']数据标准化:这里使用sklearn中的StandardScaler来进行标准化
# 数据标准化
from sklearn.preprocessing import StandardScaler
data_n