【论文笔记】2017-NIPS-Causal Effect Inference with Deep Latent-Variable Models

Causal Effect Inference with Deep Latent-Variable Models

笔者最近在做causal inference这个方向,因此会把日常读到的还(neng)不(kan)错(dong)的paper简单整理一下做个笔记,欢迎感兴趣的童鞋交流讨论~

背景

Causal inference涉及到的数据集通常由三个变量组成 { X , T , Y } \left\{X,T,Y\right\} {X,T,Y}。其中, X X X代表特征(covariate),例如病人的身体、经济状况, T T T代表某个操作(treatment),通常是0-1的,例如是否服用某种药物, Y Y Y代表输出(outcome),例如病人一段时间后的血压血糖水平。简单来说,causal inference的任务是想在给定 X X X的情况下估计 T T T Y Y Y的影响。

本文作者考虑的一个问题是如何消除hidden confounder对causal inference的影响。简单来说,confounder Z Z Z就是会对 T T T Y Y Y都产生影响的变量,例如一个人的经济实力社会地位,这些会对他是否能够服用某种药物产生影响,但 Z Z Z又是一个很难准确观测的变量。这里,作者假设可观测到的 X X X Z Z Z的代理变量,例如我们虽然很难准确度量一个人的社会地位 Z Z Z,但可以通过调查他的职业收入 X X X侧面反映 Z Z Z。这里,作者构建了一个如下的因果图:
在这里插入图片描述
这个因果图理解起来也比较直观,深色的是可以观测到的,白色的是无法观测到的, X X X Z Z Z的一个noisy observation,因此 Z → X Z\rightarrow X ZX,其他几个箭头都是causal inference里的常用假设。

方法

其实看到这个因果图,熟悉VAE的童鞋可能已经猜到了作者的思路,就是把 Z Z Z当做隐空间表示,然后套用VAE的架构。

Encoder:文章里叫inference network,结构如下图:
在这里插入图片描述
这个结构作者参考的是TARnet网络,这是causal inference里一个非常经典的深度模型,会在之后的博客里介绍。 q ( t ∣ x ) q(t|x) q(tx)是在计算propensity score(不过这个东西在原始TARnet并没有用到,估计是作者为了实验效果后加上去的一项),在学完共同特征表示之后,根据 t = 0 / 1 t=0/1 t=0/1接出两个分支。

Decoder:文章中叫model network,结构如下:
在这里插入图片描述
这个结构可以根据之前的因果图分解得到:
p ( x , t , y , z ) = p ( z ) p ( t , x , y ∣ z ) = p ( z ) p ( t , y ∣ z ) p ( x ∣ t , y , z ) = p ( z ) p ( t , y ∣ z ) p ( x ∣ z ) = p ( z ) p ( t ∣ z ) p ( y ∣ t , z ) p ( x ∣ z ) p(x,t,y,z)=p(z)p(t,x,y|z)=p(z)p(t,y|z)p(x|t,y,z)=p(z)p(t,y|z)p(x|z)=p(z)p(t|z)p(y|t,z)p(x|z) p(x,t,y,z)=p(z)p(t,x,yz)=p(z)p(t,yz)p(xt,y,z)=p(z)p(t,yz)p(xz)=p(z)p(tz)p(yt,z)p(xz)

目标函数的推导与VAE基本一致:
在这里插入图片描述
当然,就像笔者之前提到的,为了实验效果,作者又在原始VAE loss上加了新的两项:
在这里插入图片描述

结论

这应该是第一篇利用深度生成模型求解causal inference的文章,文章的motivation(解决hidden confounder)和构建因果图的方式( X X X Z Z Z的noisy observation)很让人信服,不过实验效果好像一般(hhh可能也是因为如此大家都喜欢把它当做baseline),套用VAE的框架也不算难,读起来也比较轻松。

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值