Wasserstain概率距离

Wasserstein 距离 起源于最优传输理论(维拉尼获菲尔兹奖的那个领域),又叫 Kantorovich-Rubinstein distance

对于离散概率分布,Wasserstein 距离又称为“推土机距离”(Earth Mover’s Distance)。如果我们把这些分布想象成一定数量的不同土堆,那么EMD就是将一个堆转换成另一个堆所需的最小总工作量。所需要的工作量就是一块土中的土量乘以它被移动的距离。假设相应的离散分布分别为 P r P_r Pr P θ P_{\theta} Pθ,每个都有 l l l 个可能的状态 x x x y y y,并以两个任意分布为例。

在这里插入图片描述
计算EMD本身就是一个优化问题:将土堆转移有无数种方法,我们需要找到其中最优的方法。我们的目标就是寻找最优的 γ ( x , y ) \gamma(x,y) γ(x,y),它可以直观地理解为 x x x 移到 y y y 的土量。一个有效的运输计划必须满足下面的约束:
∑ x γ ( x , y ) = P r ( y ) \mathop{\sum}\limits_x \gamma(x,y)=P_r(y) xγ(x,y)=Pr(y) ∑ y γ ( x , y ) = P θ ( x ) \mathop{\sum}\limits_y \gamma(x,y)=P_{\theta}(x) yγ(x,y)=Pθ(x) 也就是说 γ \gamma γ 是一个联合概率分布并且 γ ∈ ∏ ( P r , P θ ) \gamma\in\prod(P_r,P_{\theta}) γ(Pr,Pθ),其中 ∏ ( P r , P θ ) \prod(P_r,P_{\theta}) (Pr,Pθ) 是所有边缘分布为 P r P_r Pr P θ P_{\theta} Pθ的概率分布组成的集合。为了计算 EMD,需要将 γ \gamma γ 的每个值乘以 x x x y y y 的欧氏距离。因此,EMD可以定义为:
EMD ( P r , P θ ) = inf ⁡ γ ∈ ∏ ∑ x , y γ ( x , y ) ∥ x − y ∥ = inf ⁡ γ ∈ ∏ E ( x , y ) ∼ γ ∥ x − y ∥ \text{EMD}(P_r,P_{\theta})=\inf_{\gamma\in\prod} \sum_{x,y}\gamma(x,y) \parallel x-y \parallel = \inf_{\gamma\in\prod} \mathbb{E}_{(x,y)\sim\gamma}\parallel x-y \parallel EMD(Pr,Pθ)=γinfx,yγ(x,y)xy=γinfE(x,y)γxy
Γ = { γ ( x , y ) } ∈ R l × l \mathbf{\Gamma}=\{\gamma(x,y)\}\in\mathbb{R}^{l\times l} Γ={γ(x,y)}Rl×l D = { ∥ x − y ∥ } ∈ R l × l \mathbf{D} = \{ \parallel x-y \parallel \}\in\mathbb{R}^{l\times l} D={xy}Rl×l,则上面的定义可以写为 EMD ( P r , P θ ) = inf ⁡ γ ∈ ∏ ⟨ D , Γ ⟩ \text{EMD}(P_r,P_{\theta})=\inf_{\gamma\in\prod}\langle\mathbf{D},\mathbf{\Gamma}\rangle EMD(Pr,Pθ)=γinfD,Γ 其中 ⟨ ⋅ ⟩ \langle \cdot\rangle 是 Frobenius 内积(对应元素的乘积和)。

参考文献

从Wasserstein距离、对偶理论到WGAN

Wasserstein GAN and the Kantorovich-Rubinstein Duality

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: Wasserstein,也被称为Earth Mover's Distance (EMD),是一种衡量两个概率分布间距离的方法。它的基本思想是将一个分布视为一堆土或沙子,另一个分布视为需要将这些土或沙子移动到的目标位置。Wasserstein距离就是将一个分布转换为另一个分布所需的最小成本,其中成本是指每单位质量在空间中移动的代价。Wasserstein距离具有良好的数学性质,因此在机器学习、计算机视觉和自然语言处理等领域得到了广泛的应用。 ### 回答2: Wasserstein是一种数学衡量方式,也称为Wasserstein度量,用于衡量两个概率分布之间的距离。它在数理统计、机器学习和经济学等领域中被广泛应用。 Wasserstein度量是基于传输问题(transportation problem)的概念而发展起来的。它通过计算将一个概率分布转化为另一个概率分布所需的最小运输成本来度量它们之间的距离。这个运输成本被定义为每单位质量移动的距离与移动的质量之积的总和。 与其他常用的距离度量方法(如欧氏距离、KL散度等)相比,Wasserstein度量能够捕捉到概率分布之间更多的结构信息。由于它考虑了具体的分布形状和概率质量的移动,能够更好地处理多模态分布、长尾分布等复杂情况。 Wasserstein度量在数据生成模型、生成对抗网络(GAN)等领域中得到广泛应用。在GAN中,生成器和判别器之间的距离可以通过Wasserstein度量来衡量。这种度量方式有助于生成更真实的样本,并提高了GAN的稳定性。 另外,Wasserstein度量不仅可应用于概率分布的距离度量,而且还可以应用于图像领域中两个图像之间的差异度量。它可以用于图像生成、图像复原、图像配准等任务。 总的来说,Wasserstein度量通过计算概率分布之间的最小运输成本,提供了一种有力的距离度量方法,可以在多个领域中应用于概率分布、图像等的分析和处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zte10096334

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值