0引入
分析方法选择
(1)广告投放对销售额的影响
存在关系吗? 关系强度与形式?总体中具备这样的关系吗?是因果关系吗?
(2)营销响应中的性别差异
是否存在偏好?
(3)分析方法选择
1数量变量之间的相关性
(1)广告投放对销售额的影响
1.1散点图
1.2协方差
协方差用来衡量两个变量的总体误差,如果两个变量的变化趋势一致,协方差就是正值,说明两个变量正相关。如果两个变量的变化趋势相反,协方差就是负值,说明两个变量负相关。如果两个变量相互独立,那么协方差就是0,说明两个变量不相关。以下是协方差的计算公式:
协方差的问题是:值的大小与x和y的度量单位有关
1.3相关系数
衡量两个变量之间的强度
样本之间的相关系数用r,总体间相关系数用ρ。等于协方差除以两个变量各自的标准差。
#绘制散点图
sns.scatterplot(x='Monetary',y='Frequency',data=df)
#由散点图可以看得出来是具有相关关系的,继续计算其相关系数
#用pearson系数进行计算,可见其系数为0.95,具有较强的关系
df.corr()
#求协方差
np.cov(df['Monetary'],df['Frequency'])
#求皮尔逊系数
scipy.stats.pearsonr(df['Monetary'],df['Frequency'])
#statsmodels.formula.api.ols有关统计分析的包
from statsmodels.formula.api import ols
lm=ols('Monetary~Frequency',data=df).fit()
lm.summary()