Double Machine Learning(DML) 原理及其应用

最新推荐文章于 2025-03-01 00:45:00 发布

湖南大学研究生-杜敏

最新推荐文章于 2025-03-01 00:45:00 发布

阅读量4.5k

点赞数 1

文章标签：机器学习人工智能深度学习 python 神经网络

本文链接：https://blog.csdn.net/qq_20001941/article/details/125370078

版权

本文介绍了Double Machine Learning(DML)的原理，包括符号定义、训练过程、残差正交化的无偏差因果效应，以及如何估计平均治疗效应(ATE)和个体治疗效应(CATE)。此外，文章还探讨了DML的优势和劣势，并通过Econml库展示了DML的实际应用案例，包括不同类型的治疗和结果数据。通过模型选择和效果评估，揭示了DML在因果推断中的重要性和实用性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Double Machine Learning(DML) 原理及其应用

1. 为什么需要DML？

用
来做因果推断
- 优势
  - 减少函数形式的假设
  - 可以对高维数据进行建模
  - 自带正则化可以达到变量选择的目的
  - 劣势
    - 只关注预测效果
      - 对Treatment effect的估计可能是有偏的，需要权衡偏差和方差
      - 的收敛速度一般小于
        
        $\sqrt{n}$
    - 不能给出置信区间
- 消除偏差
- 收敛速度
  $\sqrt{n}$
- 可以构建置信区间

2. DML原理

2.1 符号定义

Y是实验影响的核心指标
T是treatment，通常是0/1变量，代表样本进入实验组还是对照组，对随机AB实验T⊥X
X是Confounder，可以简单理解为未被实验干预过的用户特征，通常是高维向量

$\begin{array}{lr}Y=\theta(x) T+g(X)+\epsilon & \text { where } E(\epsilon \mid T, X)=0 \\ T=f(X)+\eta & \text { where } E(\eta \mid X)=0\end{array}$

最直接的方法就是用X和T一起对Y建模，直接估计
。但这样估计出的

往往是有偏的，偏差部分来自于对样本的过拟合，部分来自于

估计的偏差

2.2 DML训练过程

利用任意ML模型拟合Y和T得到残差
$\hat{Y}$ ，

$\hat{T}$

$\hat{Y} = Y - l(x) \quad where \quad l(x) = E(Y|x) \\$

$\hat{T} = T - m(x) \quad where \quad m(x) = E(T|x) \\$
对
$\hat{Y}$ ，

$\hat{T}$ 利用任何ML模型拟合

$\theta$

的拟合可以是参数模型也可以是非参数模型，参数模型可以直接拟合。而非参数模型因为只接受输入和输出所以需要再做如下变换，模型target变为

$\frac{\hat{Y}}{\hat{T}}$ , 样本权重为

$\hat{T}^2$

最低0.47元/天解锁文章