【Python实战因果推断】52_因果推理概论2

目录

Association and Causation

The Treatment and the Outcome

The Fundamental Problem of Causal Inference


Association and Causation

直观上,你大概明白为什么相关性并不等于因果性。如果有人告诉你顶级咨询能促使你的业务改善,你难免会持怀疑态度。你怎么能确定是咨询公司真正促成了业务的提升,还是仅仅因为只有繁荣的企业才有能力聘请这些服务?

为了使事情更具体一点,设想你自己是一家在线市场公司的负责人。小型和中型企业使用你们的在线平台来宣传和销售产品。这些企业在诸如定价和促销时机等方面拥有完全自主权。但对你公司而言,这些企业的繁荣至关重要。因此,你决定通过给予指导来帮助他们,告诉他们如何、是否以及何时设立销售活动,即向消费者宣布暂时降价。要做到这一点,首先你需要了解的是降价对销售量的影响。如果增加的销量所带来的收益能够弥补低价销售的损失,那么促销活动就是个好主意。如果你还没注意到,这是一个因果问题。你需要回答的是,企业如果降价,相比不做任何改变,会多卖出多少额外的单位商品。

不用说,这是一个复杂的问题;也许对开头太复杂了。不同的企业在你的平台上运营。有的卖食品;有的卖衣物。有的卖化肥和农业用品。因此,降价可能对不同类型的企业有不同的影响。例如,对服装企业来说,在父亲节前一周宣布降价可能是个好主意。然而,类似的降价对农业企业可能几乎没什么效果。因此,让我们简化这个问题。让我们将注意力集中在一种类型的企业上:那些销售儿童玩具的企业。同时,让我们关注一年中的一个时期:圣诞节前的十二月。目前,你只尝试回答,在这些时期降价如何增加销售,这样你就可以将这些信息传递给儿童玩具行业的企业,让他们做出更好的决策。

为了决定促销是否是个好主意,你可以利用多个儿童玩具企业的信息。这些数据存储在一个pandas数据帧中供你访问。以下是前几行数据,以便你了解你正在处理的内容:

第一列是商店的唯一标识符(ID)。你拥有每个商店在十二月份的每周数据。你还有关于每个企业规模的信息,以当年每周平均销售的产品数量表示。一个布尔列(0或1)标记了该企业在当时是否正在进行促销活动。最后一列显示了该商店在那一周的平均每周销售额。

The Treatment and the Outcome

现在你已经有了一些数据可供分析,是时候学习我们的第一个技术要点了。让我们称 Ti​为单位i的处理:

T_i=\begin{cases}1\text{ if unit }i\text{ received the treatment}\\0\text{ otherwise}\end{cases}

这里的处理并不一定是指药物或医疗领域的任何东西。相反,它只是一个术语,我将用它来表示某种我想了解其效果的干预。在这个案例中,处理仅仅是在线平台内某家企业的一次降价,由is_on_sale列表示。

此外,我将把weekly_amount_sold(这里我想影响的变量)称为结果。我将用Yi​来表示单位i的结果。借助这两个新概念,我可以重新表述因果推断的目标,即学习处理T对结果Y的影响。在我们的例子中,这就相当于弄清楚is_on_sale对weekly_amount_sold的影响。

The Fundamental Problem of Causal Inference

这里问题变得有趣起来了。因果推断的根本问题在于,你无法在同一单位上同时观察到施加处理和未施加处理的情况。这就像是你面临两条分岔路,只能了解你选择走的那条路前方的情况。为了充分理解这个问题,让我们回到之前的例子,并绘制处理与结果的关系图,也就是根据is_on_sale来展示weekly_amount_sold。你可以立即发现,降价的商店销售量明显更高。

这也符合我们对世界运作方式的直觉:当价格低时,人们会购买更多,而促销(通常)意味着更低的价格。这是非常好的现象,因为因果推断与专家知识相辅相成。但你不能太过掉以轻心。给予折扣并加以宣传很可能会让顾客购买更多,但真的会多这么多吗?从图中可以看出,当有促销活动时,平均销售量似乎比没有促销时高出约150个单位。这听起来异常高,因为没有促销时的销售量范围大约在0到50个单位之间。如果你仔细思考,就会开始意识到你可能将关联性误认为因果性。可能只有大型企业,也就是本来就销售最多的企业,才能负担得起大幅度降价。也可能企业在接近圣诞节时进行促销,而这正是顾客购买最多的时期。

关键在于,只有当你能够在同一时间观察到同一个企业(单位),在有无促销的情况下,你才能确信降价对销售量的真实影响。只有比较这两种反事实的情况,你才能确定降价的效果。然而,正如前面讨论过的,因果推断的根本问题是,你根本无法做到这一点。相反,你需要想出其他办法。

  • 15
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
贝叶斯因果推断是一种使用贝叶斯网络(Bayesian Network)进行因果关系推断的方法。贝叶斯网络是一种概率图模型,用于表示变量之间的依赖关系和因果关系。在贝叶斯网络中,节点表示变量,边表示变量之间的依赖关系。通过观察节点的状态,可以推断其他节点的状态。 在Python中,可以使用PyMC3库来构建贝叶斯网络模型。《Python贝叶斯分析》这本书从实际应用和编写程序的角度解释了贝叶斯统计的关键概念,并介绍了如何使用PyMC3来构建概率模型。这本书不要求读者具备生物学方面的基础知识,但需要读者具备使用Python编写程序的经验\[1\]。 贝叶斯因果推断的一个挑战是数据的结构与贝叶斯网络的独立性不一致。贝叶斯网络的推断算法旨在从概率中推断因果关系,与任何实验无关。因此,贝叶斯网络的推断是基于概率观察数据进行的。此外,贝叶斯网络的推断是从特定前提中得出一般性结论,与理论假设的表述无关。这是因为贝叶斯网络的推断是演绎的,而不是从因果假设的表述中得出的\[3\]。 因此,Python中的贝叶斯因果推断可以通过构建贝叶斯网络模型,并使用PyMC3库进行推断。这种方法可以帮助我们从观察数据中推断因果关系,并进行因果推断分析。 #### 引用[.reference_title] - *1* [Python贝叶斯分析 PDF 完整原版](https://blog.csdn.net/weixin_39850143/article/details/110996376)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [数学推导+纯Python实现机器学习算法12:贝叶斯网络](https://blog.csdn.net/weixin_37737254/article/details/102920363)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [贝叶斯因果网络_因果关系和贝叶斯网络](https://blog.csdn.net/weixin_26752765/article/details/108132740)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

水木流年追梦

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值