python anova statsmodels_Python数据科学实践 | 统计建模3

640更多精彩,请点击上方蓝字关注我们!

93d0b1459032209d822d70d8d17986b4.png

大家好,基于Python的数据科学实践课程又到来了,大家尽情学习吧。本期内容主要由程茜与政委联合推出。

5.4 统计假设检验

在上一节中的模型参数估计中也会涉及到假设检验,但是这都是模型拟合过程中自动给出的结果。本章专门以方差分析为例展示Statsmodels模块的另一项主要功能。首先,大家思考这么一个问题。人们在选火锅团购产品时都习惯于在APP页面看每家店铺的评分,毕竟过来人的经验还是需要参靠地。细心的吃货就会问个问题:不同的评分团购产品的销量是否有差异?这就涉及到统计中的假设检验问题。用什么方法可以解决这个问题?方差分析。

方差分析是利用样本数据检验两个或两个以上总体均值间是否有差异的一种方法。根据研究变量的个数不用,分为单因素方差分析和多因素方差分析。如果我们要解决多个总体的均值是否有差异的检验问题,这就是单因素方差分析;如果是多个自变量对因变量影响,就是多因素方差分析。

5.4.1 问题提出 a5d9c494a7dd65d1ccfd0c965e41a401.png

一元单因素方差分析是研究单独一个因素对因变量的影响。首先根据这个单独的因素的不同水平对因变量进行分组,计算其组间和组内方差。之后,对各组的均值比较,最终对每个分组均值相等这个原假设进行检验。

以火锅团购数据为例,因变量是销量(购买人数)。每销售一单,客户都会对其进行评分。此时,我们可以来查看下数据集中的评分,如例1。

例1 火锅数据集

 data_shop.head()

c4c2fe31034d15aa4d405a0cdaaf7580.png

图1  数据前6行

对因变量购买人数做对数运算,并将“评分”变量转化为分类变量并给出其新的标签:

<
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值