Wasserstein距离

最新推荐文章于 2023-11-20 15:14:10 发布

Nightmare004

最新推荐文章于 2023-11-20 15:14:10 发布

阅读量519

点赞数

分类专栏：深度学习数学文章标签：算法人工智能机器学习深度学习

本文链接：https://blog.csdn.net/qq_39942341/article/details/131534694

版权

数学同时被 2 个专栏收录

143 篇文章 18 订阅

订阅专栏

深度学习

49 篇文章 2 订阅

订阅专栏

前置知识：Computational optimal transport

Kantorovich’s optimal transport problem

$\mathrm{L}_{\mathbf{C}}(\mathbf{a}, \mathbf{b}) \stackrel{\text { def. }}{=} \min _{\mathbf{P} \in \mathbf{U}(\mathbf{a}, \mathbf{b})}\langle\mathbf{C}, \mathbf{P}\rangle$

$\mathbf{U}(\mathbf{a}, \mathbf{b}) \stackrel{\text { def. }}{=}\left\{\mathbf{P} \in \mathbb{R}_{+}^{n \times m}: \mathbf{P} \mathbf{1}_m=\mathbf{a} \quad \text { and } \quad \mathbf{P}^{\mathrm{T}} \mathbf{1}_n=\mathbf{b}\right\}$

对偶

$\mathrm{L}_{\mathbf{C}}(\mathbf{a}, \mathbf{b})=\max _{(\mathbf{f}, \mathbf{g}) \in \mathbf{R}(\mathbf{a}, \mathbf{b})}\langle\mathbf{f}, \mathbf{a}\rangle+\langle\mathbf{g}, \mathbf{b}\rangle$

$\mathbf{R}(\mathbf{a}, \mathbf{b}) \stackrel{\text { def. }}{=}\left\{(\mathbf{f}, \mathbf{g}) \in \mathbb{R}^n \times \mathbb{R}^m: \mathbf{f} \oplus \mathbf{g} \leq \mathbf{C}\right\}$

Wasserstein距离

考虑 $p\ge 1$
令 $\mathbf{C} = \mathbf{D}^p\in\mathbb{R}^{n\times n}$
其中 $\mathbf{D}$ 是距离，即满足
(1) $\mathbf{D}\in\mathbb{R}_+^{n\times n}$ 是对称的
(2) $\mathbf{D}_{i,j}=0$ 当且仅当 $i = j$
(3) $\forall i,j,k, \mathbf{D}_{i,k}\le \mathbf{D}_{i,j}+\mathbf{D}_{j,k}$

则
$\mathrm{W}_p(\mathbf{a}, \mathbf{b}) \stackrel{\text { def. }}{=} \mathrm{L}_{\mathbf{D}^p}(\mathbf{a}, \mathbf{b})^{1 / p}$
称为p-Wasserstein distance，
可以证明p-Wasserstein distance也是距离

证明：
再说

对偶

$\mathrm{W}_p(\mathbf{a}, \mathbf{b})=\max _{(\mathbf{f}, \mathbf{g}) \in \mathbf{R}(\mathbf{a}, \mathbf{b})}\langle\mathbf{f}, \mathbf{a}\rangle+\langle\mathbf{g}, \mathbf{b}\rangle$
$\mathbf{R}(\mathbf{a}, \mathbf{b}) \stackrel{\text { def. }}{=}\left\{(\mathbf{f}, \mathbf{g}) \in \mathbb{R}^n \times \mathbb{R}^n: \mathbf{f} \oplus \mathbf{g} \leq \mathbf{D}^p\right\}$

而

$\mathbf{f} \oplus \mathbf{g} \leq \mathbf{D}^p\Rightarrow f_i +g_i\le 0$
因此
$\langle\mathbf{f}, \mathbf{a}\rangle+\langle\mathbf{g}, \mathbf{b}\rangle=\sum_{i=1}^{n}\left(f_ia_i + g_ib_i\right)\le \sum_{i=1}^n\left(f_ia_i -f_i b_i\right)$

搬土距离

Earth Mover’s Distance
考虑有两个概率分布 $P_r,P_\theta$
则
$\operatorname{EMD}\left(P_r, P_\theta\right)=\inf _{\gamma \in \Pi} \sum_{x, y}\|x-y\| \gamma(x, y)=\inf _{\gamma \in \Pi} \mathbb{E}_{(x, y) \sim \gamma}\|x-y\|$
考虑对偶
$\operatorname{EMD}\left(P_r, P_\theta\right)=\sup _{\|f\|_{L \leq 1}} \mathbb{E}_{x \sim P_r} f(x)-\mathbb{E}_{x \sim P_\theta} f(x) .$
$\|f\|_{L \leq 1}$ 表示Lipschitz连续，其中Lipschitz常数为 $L$
即 $\left|f\left(\mathbf{x}\right)-f\left(\mathbf{y}\right)\right|\le L\|\mathbf{x}-\mathbf{y}\|$