在鲁棒优化中见到一个名词:Wasserstein distance, 又称作 earth mover’s distance,推土距离。用来测量两个随机分布的距离。
之所以叫推土距离,是因为它的物理含义是:将一个随机分布的直方图,变化成另一个随机分布的直方图,直方图变动的最小距离和。直方图中的每个小柱子可以视作一个土堆。
对于两个随机变量
u
u
u,
v
v
v, 它们的
p
p
p 阶 Wasserstein 距离的定义表达式为:
W
p
=
(
inf
γ
∈
Γ
(
u
,
v
)
∫
d
(
x
,
y
)
p
d
γ
(
x
,
y
)
)
1
/
p
W_p=\left (\inf_{\gamma\in\Gamma(u,v)}\int_{}d(x,y)^pd\gamma(x,y)\right)^{1/p}
Wp=(γ∈Γ(u,v)inf∫d(x,y)pdγ(x,y))1/p
其中, Γ ( u , v ) \Gamma(u,v) Γ(u,v) 是随机变量 u u u 与 v v v 的联合分布,这个表达式不是很容易理解或计算,一般用下面这个等价的表达式:
W p = ( ∫ 0 1 [ F u − 1 ( x ) − F v − 1 ( x ) ] p d x ) 1 / p W_p=\left(\int_{0}^1 [F^{-1}_u(x)-F^{-1}_v(x)]^pdx\right)^{1/p} Wp=(∫01[Fu−1(x)−Fv−1(x)]pdx)1/p
其中, F u F_u Fu 与 F v F_v Fv 分别是随机变量 u u u, v v v 的累计分布函数。
若是样本数据,则可以根据样本计算出随机变量的经验分布函数,将上面的积分转化成很多小区间的加和,进而计算出 Wasserstein 距离。