因果推断(一):因果推断涉及的各种变量

本文介绍了统计学和数据分析中关于变量、处理变量(如二元和连续处理)、结果变量(潜在结果与观测结果)的概念,重点阐述了稳定单位处理值假设(SUTVA)和一致性假设。同时讨论了协变量,包括混杂变量和工具变量,并提到了econml和causalml库在处理这些概念时的差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


写在前面:最近开始学习因果机器学习,想着整理一下其中的涉及到一些专有名词和一些概念。后面的话会更多以代码的方式记录一下我的学习过程。

变量

在统计学和数据分析领域,变量是表示某种属性、特征或度量的符号和标签。变量可以是数值型,也可以是类别型。

处理变量

随机对照实验是统计学的黄金标准。一个随机对照实验中,所有影响结果变量的因子要么是静态的要么是随机变化的,所以一定是唯一的输入变量导致了结果变量的变化。然而,许多问题不适合随机对照实验。在随机对照实验不好开展的情况下,学者转而进行观察性研究,即记录数据而不是控制数据。这样的问题是很难将因果与单纯的相关关系中区分开来。
对一个变量干预与以一个变量为条件是不同的。我们干预一个变量时固定了它的值,改变了系统后其他变量的值通常因此改变。我们以一个变量为条件时,什么也没改变,只是将注意力集中在这个变量取我们感兴趣值的子集上。
这里所说的干预变量就是处理变量,也就是treatment。分为二元处理变量和连续处理变量。

结果变量

结果变量分为潜在结果和观测结果,当满足一致性假设时,潜在结果 = 观测结果
这里引入三个因果推断的基本假设的一致性假设(Consistency)

假设一:稳定单位处理值假设(SUTVA, Stable Unit Treatment Value Assumption),也叫一致性假设(Consistency)

任何单位的潜在结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值