因果推断后门准则具体例子

最新推荐文章于 2025-06-10 19:55:42 发布

Doc.S

最新推荐文章于 2025-06-10 19:55:42 发布

阅读量901

点赞数 16

文章标签：人工智能机器学习算法

本文链接：https://blog.csdn.net/m0_54720701/article/details/148503318

版权

以下是一个基于医疗场景的后门准则（Backdoor Criterion）详细应用案例，结合因果图模型与实际分析步骤展开：

问题：研究某新型药物（X）对心脏病患者康复（Y）的因果效应，需排除年龄（Z）的混杂影响。

变量关系：

关键观察：

路径定义：后门路径是从X到Y的路径中，存在指向X的箭头（即X有父节点）。
路径分析：在本例中，唯一的后门路径是X ← Z → Y。若不控制Z，药物与康复的相关性可能被年龄干扰（例如，老年人服药多但康复率低，导致药物效果被低估）。

未调整时的偏倚：
假设原始数据中，服药组康复率为40%，未服药组为30%，表面上药物有效。但实际可能因老年患者占比高（如服药组中老年人占70%，未服药组占30%），导致康复率差异被年龄掩盖。
调整后的因果效应：
通过分层计算发现：
- 青年组：服药康复率60% vs 未服药40% → 因果效应+20%
- 老年组：服药康复率30% vs 未服药20% → 因果效应+10%
- 总体ATE = 20%×0.4（青年比例） + 10%×0.6（老年比例） = 14%
  即药物真实效果为提升康复率14%，而非原始数据中的10%。

直接回归的误导性：
若直接拟合模型 (Y = \beta_0 + \beta_1 X + \epsilon)，系数(\beta_1) 可能仅反映相关性，而非因果性。例如，若年龄未被纳入模型，(\beta_1) 会同时包含药物的真实效果和年龄的混杂效应。
分层分析的优势：
通过后门调整，分层分析明确分离了年龄的影响，确保组内比较的公平性（即同年龄组内服药与未服药患者的差异仅由药物引起）。

通过本例可见，后门准则为观测性研究提供了严谨的因果推断工具，尤其适用于随机对照试验（RCT）不可行的场景（如医疗、社会科学）