因果效应,典型模型及wasserstein距离, BNN,CFR,SITE,NetDeconf

CFR_net

网络结构

在这里插入图片描述

目标函数

设计思想

L o s s = ϵ F + r e g _ L o s s + ϵ C F (1) Loss=\epsilon_F+reg\_Loss+\epsilon_{CF}\tag 1 Loss=ϵF+reg_Loss+ϵCF(1)
由如下推导可知其 I M P ( Φ ( x ) ) IMP(\Phi(x)) IMP(Φ(x)) 决定了 counterfactual loss 的上界, 即 upper error bound.
在这里插入图片描述
于是, 可得整体的目标函数为:
在这里插入图片描述

balanced learning

由于混淆变量导致的样本分布不均是因果效应预估的重大挑战. 那么该任务的关键就是在特征的表示空间上学到一个均衡的分布.

wasserstein 距离

用于衡量两个分布之间的差异, 具体地, 它描述了由一个分布转变为另一个分布所需要的最小代价.

离散直观举例

该问题来源于 optimal transport 最优传输问题, 一个直观的例子见下.
有一批石子分布在n个发货地址, 需要运送到m个有需求的收货地址. 令运输代价=运输数量 * 运输距离.

  • 发货地址的石子分布为 p ( 1 ) , . . . , p ( n ) {p(1),...,p(n)} p(1),...,p(n); 收货地址的石子分布为 q ( 1 ) , . . . , q ( m ) {q(1), ..., q(m)} q(1),...,q(m), 总的供需平衡;
  • d i s t ( i , j ) dist(i,j) dist(i,j)表示两个地址之间的距离;
  • n u m ( i , j ) num(i,j) num(i,j) 表示某种运输方案T下, 从i地到j地运输的石子数量.
    那么该方案下的代价 为
    c o s t ( p , q , t ) = ∑ j m ∑ i n d i s t ( i , j ) × n u m ( i , j ) cost(p,q,t)=\sum_j^m \sum_i^n dist(i,j) \times num(i,j) cost(p,q,t)=jmindist(i,j)×num(i,j).
    不同的方案有不同的代价, wasserstein 距离就是其中最小的代价.
    w a s s ( p , q ) = m i n ∑ j m ∑ i n d i s t ( i , j ) × n u m ( i , j ) wass(p,q)=min \sum_j^m \sum_i^n dist(i,j) \times num(i,j) wass(p,q)=minjmindist(i,j)×num(i,j)

连续数学抽象

该定义来自参考[5]
Ω \Omega Ω 是一个任意空间, D 是该空间的一个距离度量, μ ( x ) , ν ( x ) \mu(x),\nu(x) μ(x),ν(x)是点x在该空间的两个概率密度函数.
wasserstein distance定义为:
w a s s ( μ , ν ) = inf ⁡ π ∈ ∏ ( μ , ν ) ∫ Ω 2 D ( x , y ) d π ( μ , ν ) wass(\mu,\nu) =\inf_{\pi \in \prod(\mu,\nu)} \int_{\Omega^2} D(x,y) d\pi(\mu,\nu) wass(μ,ν)=π(μ,ν)infΩ2D(x,y)dπ(μ,ν)
where ∏ ( μ , ν ) \prod(\mu,\nu) (μ,ν) 是联合概率分布. 其两个边缘概率分布可表示为
∫ ν π ( μ , ν ) = μ \int_\nu \pi(\mu,\nu)=\mu νπ(μ,ν)=μ, ∫ μ π ( μ , ν ) = ν \int_\mu \pi(\mu,\nu)=\nu μπ(μ,ν)=ν.
符号 inf 为infimum, 表示下确界, 可简单理解为 min.

距离求解的代码实现

由 wasserstein 距离 的定义可知, 它不像向量距离这样是一个现成的闭式解表达式, 而是一个最优化问题. 求解涉及到 dual 对偶转换, 且有较大的计算复杂度.
在 python中, tensorflow 中怎么近似快速计算 wasserstein 距离, 参考[2,4]的附录代码中均给出了同样的实现, 它的实现又是来自参考[5].

与KL散度的关系

通常机器学习的多分类任务中会涉及到 交叉熵, 它等于KL散度减去一个固定的值. 但KL散度不满足距离的定义.

参考

  1. BNN, ICML2016
  2. CFR_net,ICML 2017, paper, code
  3. SITE,NeuralIPS 2018
  4. NetDeconf,WSDM2020, paper, code
  5. ICML2014,Fast Computation of Wasserstein Barycenters
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值