项目背景:
对于宝洁这一类的快消品企业,能够对商超门店的销售额做出精准的预测,尤其是能量化自身所控制的各种促销因素所能产生的效果,以对营销资源做出合理规划,是非常重要的。本项目中,我们根据电视广告,线上,线下,门店内,微信渠道等促销投入和销售额的结果进行回归分析,以实现对各类因素投入产出比做出评估。
分析需求说明:
对各类的营销因素,投入产出比进行评估分析。分析各类营销的效果与产出。
分析流程:
1.数据概况分析:数据行/列数量,缺失值的分布等。
2.单变量分析:数字型变量的指标描述,类别变量的分类占比情况。
3.多变量分析:按类别交叉对比,变量之间的相关性分析。
4.回归模型:模型建立,模型评估与优化。
分析过程:
#导入所需要的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文显示问题-设置字体为黑体
plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
#读取数据
df = pd.read_csv(r'baojie.csv',index_col = 0)
df.info()
输出结果:
image.png
字段说明:
revenue :门店销售额
reach :微信推送次数
local_tv :本地电视广告投入
online :线上广告投入
instore :门店内海报陈列投入
person:门店销售人员投入
event促销事件:cobranding