Causal Inference in Statistics读书笔记-chapter1

本书第一章介绍了因果关系的重要性,通过辛普森悖论展示了因果关系在统计决策中的复杂性。作者指出,传统的统计方法难以直接揭示因果关系,需要额外的统计模型来处理。书中定义了因果关系,并预告了后续章节将探讨如何建立因果模型、连接模型与数据,以及如何基于数据和模型推断因果结论。此外,还回顾了独立性、条件独立性等统计基础知识。
摘要由CSDN通过智能技术生成

Chapter1

Preliminaries: Statistical and Causal Models

1. Why Study Causation

“causation”的意思是因果关系,学习因果关系是因为我们需要通过理解数据来做出更好的决策和行动,从失败或者成功的经历中获取知识。作者通过辛普森悖论来讲述了因果关系在统计学习中的重要性。

## Simpson 悖论 我们想测试一种新研制出的药物对A疾病是否有效,邀请了700位病人来进行试验,其中一半服用新药,一半不服用。得到的结果如下表:

根据实验结果,如果是女/男患者,那么医生应该给患者服用新药,如果是一个不知性别的患者,那到底我们应该根据性别分组的结果给患者用药呢,还是根据总体数据的结果不给患者用药呢?这就是由于缺少问题因果关系而产生的悖论。

在变量连续的问题上同样存在这样的问题。

如果不考虑年龄的话,Cholesterol跟Exercise是正相关的,一旦考虑了年龄,二者就是负相关的。

由上面两个例子可以看出,利用传统的统计方法,我们很难直接从数据中获得因果关系的信息,通常我们都是对因果关系进行假设,比如上面的例子中假设性别对药效是有影响的,但这样的假设很可能导致悖论的发生。所以我们考虑 利用额外的统计方法来表达因果关系假设,这些方法就是这本书的重点。为了理解数据背后的因果关系,我们需要解决下面几个问题:

  • 如何定义因果关系(causation)
  • 如何表达因果关系的假设,即如何建立一个因果模型(causal model)
  • 如何将因果模型和数据特征连接起来
  • 如何通过结合数据及模型中隐藏的因果关系假设来得出结论

首先定义causation,如果变量Y的取值依赖于变量X的取值,我们说X是产生Y的原因(X is a cause of Y).其余问题在书后面几章进行回答。

2.Perimilinaries

下面是一下必要的统计知识和图论知识。

Independent 独立

我们称事件 A A 与事件 B 相互独立,当 P(A|B)=P(A) P ( A | B ) = P ( A ) 时。

Conditionally Independent 条件独立

条件独立是图网络一个很重要的概念。两个事件A和B,对另一事件C,如果满足

P(A|B,C)=P(A|C),P(B|A,C)=P(B|C) P ( A | B , C ) = P ( A | C ) , P ( B | A , C ) = P ( B | C )

则称事件A与事件B条件独立。

贝叶斯公式

P(A|B)=P(B|A)P(A)P(B) P ( A | B ) = P ( B | A ) P ( A ) P ( B )

全概率公式

对于事件 A A 和一系列事件 B 1 , B 2 B n ,事件 A

  • 5
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
因果推断是统计学中的一种研究方法,旨在确定因果关系。它关注的是某个变量对其他变量的影响,以及确定这种影响是真实的还是由于随机巧合而产生的。 因果推断的理论基础是概率推理和统计推断。通过收集并分析大量的数据,我们可以将变量与因果关系联系起来,以确定其是否具有因果联系。在统计学中,常用的因果推断方法包括实验设计、随机对照试验和倾向得分匹配等。 实验设计是因果推断的一个重要工具。在实验设计中,研究者通过对两组或多组个体施加不同的干预措施来比较结果,以确定干预是否导致了观察到的结果。随机对照试验是一种常用的实验设计,其中将个体随机分配到干预组和对照组,以排除其他因素对结果的影响。 倾向得分匹配是一种非实验设计的因果推断方法。它通过将受干预的个体与未受干预的个体进行匹配,以消除不同个体之间的潜在差异,并从中推断出因果效应。倾向得分是一个衡量被干预和未被干预个体之间潜在差异的分数,匹配后,可以使用匹配样本的平均差异来估计因果效应。 因果推断在许多领域都有广泛的应用,如医学研究、社会科学和经济学等。通过进行因果推断,我们可以更好地理解事件之间的因果关系,为决策提供科学依据。然而,因果推断也面临着一些挑战,如数据的可获得性和潜在的混淆因素的控制等。 总之,因果推断是统计学中一种重要的研究方法,可以帮助我们确定变量之间的因果关系。它使用数学和统计工具来解决因果推断的问题,并在许多领域中发挥着重要作用。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值