公司是做广告投放的,业务中会遇到一些有趣的问题。下面记录一个关于多因素方差分析的栗子:
广告页X的点击可能和广告页背景色与投放的区域有关系 ,我们设广告页背景色为因素A,投放区域为因素B。同时对因素A,B进行分析。下面lets go…
数据准备:广告投放数据(脱敏处理)
分析工具:pycharm
运用语言:python 3.7
统计分析思想:多因素方差分析
原假设:广告页X的点击可能和广告页背景色与投放的区域没有关系
备择假设:广告页X的点击可能和广告页背景色与投放的区域有关系
我们用到的库:
pandas
statsmodels
导入库
import pandas as pd
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm
from statsmodels.stats.multicomp import pairwise_tukeyhsd
读取数据
data=pd.read_excel(r"D:\aaa.txt\double.xlsx")
print(data) #三个语句,查看数据基本信息
print(data.info())
print(data.describe())
area为投放区域,backcolor为广告页背景色。
1:
area backcolor cl