方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。
方差分析的步骤:
1、建立检验假设;
H0:多个样本总体均值相等;H1:多个样本总体均值不相等或不全等。
检验水准为0.05。
2、计算检验统计量F值;
3、确定P值并作出推断结果。
本例P值大于0.05,接受原假设,不同渠道对流量的影响无显著差异。
da=pd.DataFrame({'channel':['paid_search','paid_search','paid_search','paid_search','paid_search','paid_search','paid_search','paid_search'
,'organic_search','organic_search','organic_search','organic_search','organic_search','organic_search','organic_search','organic_search'
,'social','social','social','social','social','social','social','social']
,'value':[2500,2300,2700,1800,2900,2000,1700,2100,2400,1300,1700,3000,2800,2500,2100,2000,1200,1800,2100,1700,2000,1600,1800,1900]
})
formula='{} ~ {}'.format(da.columns[1],da.columns[0])
model=ols(formula,data=da).fit()
anovat=anova_lm(model)
print(anovat)