EDA数据相关性分析--度量数据之间的关系

0引入

分析方法选择

(1)广告投放对销售额的影响

存在关系吗? 关系强度与形式?总体中具备这样的关系吗?是因果关系吗?

(2)营销响应中的性别差异

 是否存在偏好?

(3)分析方法选择

1数量变量之间的相关性

(1)广告投放对销售额的影响

 1.1散点图

1.2协方差

协方差用来衡量两个变量的总体误差,如果两个变量的变化趋势一致,协方差就是正值,说明两个变量正相关。如果两个变量的变化趋势相反,协方差就是负值,说明两个变量负相关。如果两个变量相互独立,那么协方差就是0,说明两个变量不相关。以下是协方差的计算公式:

 协方差的问题是:值的大小与x和y的度量单位有关

1.3相关系数

衡量两个变量之间的强度

样本之间的相关系数用r,总体间相关系数用ρ。等于协方差除以两个变量各自的标准差。

#绘制散点图
sns.scatterplot(x='Monetary',y='Frequency',data=df)
#由散点图可以看得出来是具有相关关系的,继续计算其相关系数
#用pearson系数进行计算,可见其系数为0.95,具有较强的关系
df.corr()
#求协方差
np.cov(df['Monetary'],df['Frequency'])
#求皮尔逊系数
scipy.stats.pearsonr(df['Monetary'],df['Frequency'])

#statsmodels.formula.api.ols有关统计分析的包
from statsmodels.formula.api import ols
lm=ols('Monetary~Frequency',data=df).fit()
lm.summary()

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值