Wasserstein Disstance

最新推荐文章于 2024-04-10 15:45:02 发布

碧落回雪

最新推荐文章于 2024-04-10 15:45:02 发布

阅读量352

点赞数 2

分类专栏：超分辨模式识别文章标签：超分辨模式识别

本文链接：https://blog.csdn.net/zjy_snow/article/details/82745272

版权

超分辨同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

模式识别

3 篇文章 0 订阅

订阅专栏

Earth Mover’s Distance

先说直方图，直方图可以用集合来表示， $s=\{s_1, s_2,...,s_n\}$ ，其中 $s_j=(m_j, w_j)$ ， $m_j$ 表示直方图第 $j$ 组， $w_j$ 表示第 $j$ 组的统计数量。那么已知两个直方图
$P=\{p_1, p_2,...,p_n\}=\{(m_{p_1}, w_{p_1}), (m_{p_2}, w_{p_2}),...,(m_{p_n}, w_{p_n})\} \\ Q=\{q_1, q_2,...,q_n\}=\{(m_{q_1}, w_{q_1}), (m_{q_2}, w_{q_2}),...,(m_{q_k}, w_{q_k})\}$

图1

现在要把直方图 $P$ 变为 $Q$ ，将直方图的每一组看作是一堆土， $m_j$ 表示分组， $w_j$ 表示第 $m_j$ 组中土的质量，变换过程就是一个推土的过程。定义一个距离矩阵 $D=[d_{ij}]$ 表示 $m_{p_i}$ 与 $m_{q_j}$ 之间的距离，定义 $F=[f_{ij}]$ 表示每次从 $m_{p_i}$ 搬运 $f_{ij}$ 的土到 $m_{q_j}$ 中。如图1，搬运过程可以看作将 $P$ 中的的每个分组都独立的分成多个分块 $f_{ij}$ ，再从 $p_{i}$ 中取出放到 $q_{j}$ 中。那么最小化搬运距离
$\min {\sum_{i=1}^n{\sum_{j=1}^k{f_{ij}d_{ij}}}}$
并且使得
$f_{ij} \ge 0, 1 \le i \le n, 1 \le j \le k \\ \sum_{j=1}^k{f_{ij}} \le w_{p_i}, 1 \le i \le n \\ \sum_{i=1}^n{f_{ij}} \le w_{q_j}, 1 \le j \le k \\ \sum_{i=1}^n{\sum_{j=1}^k{f_{ij}}} = \min {\left \{\sum_{i=n}^k{w_{p_i}}, \sum_{j=1}^k{w_{q_j}} \right\} }$
解出最优的 $F$ ，就可以计算Earth Mover’s距离（EMD，别问我为啥不翻译这个，推土距离什么的太难听了）如下
$\mathrm{EMD} = \frac {\sum_{i=1}^n{\sum_{j=1}^k{f_{ij}d_{ij}}}}{\sum_{i=1}^n{\sum_{j=1}^k{f_{ij}}}}$
EMD其实也就是上面最优搬运距离的期望。关于EMD可以参考图像检索:EMD距离(Earth Mover’s Distance)及纠错

Wasserstein Disstance

Wasserstein距离其实就是Earth Mover’s距离，不过呢，上面提到的Earth Mover’s距离是基于直方图的，离散的。如何用Earth Mover’s距离去衡量两个分布的距离呐？首先，可以看将概率密度函数看作是连续的直方图

图2

那么对数据进行采样得到的样本可以被看作是直方图的统计，概率高的区间采样得到的样本数量也就越多，那么将EMD改写下，WGAN的论文里就提出了Wasserstein距离如下

$W(\mathbb{P}_r, \mathbb{P}_g)=\inf_{\gamma \in \Pi(\mathbb{P}_r, \mathbb{P}_g)}{\mathbb{E}_{(x,y)\sim\gamma}[||x-y||]}$

其中， $\inf$ 是求解函数的下界， $\mathbb{P}_r$ 和 $\mathbb{P}_g$ 是联合分布 $\gamma(x,y)$ 的边缘分布， $\Pi(\mathbb{P}_r, \mathbb{P}_g)$ 是满足 $\gamma$ 分布的所有样本集合， $(x, y)$ 是从真实数据和生成数据中采样得到的样本对， $\gamma(x,y)$ 表明了每次由 $x$ 向 $y$ 搬运的量， $∣ ∣ x - y ∣ ∣$ 表明了从 $x$ 到 $y$ 的距离。那么 $W$ 和 $\mathrm{EMD}$ 其实是等价的。作者在WGAN中提出使用Wasserstein距离其实也就是想让生成数据的分布逐渐向真实数据的分布靠拢。

以上是我对Wasserstein距离的理解，当然因为本身EMD涉及到测度学的知识以及一些其他我没学习过的知识，这里只是用我所知道去理解EMD以及Wasserstein距离，可能会有理解问题和不严谨的推导，欢迎指正

碧落回雪

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Wasserstein Disstance

Wasserstein Disstance先简单记录下对这个距离的理解，后续补全首先，WGAN的论文里提出了Wasserstein距离 W(Pr,Pg)=infγ∈Π(Pr,Pg)E(x,y)∼γ[||x−y||]W(Pr,Pg)=infγ∈Π(Pr,Pg)E(x,y)∼γ[||x−y||]W(\mathbb{P}_r, \mathbb{P}_g)=\inf_{\gamma \in \P...
复制链接

扫一扫

专栏目录