Wasserstein distance
https://www.zhihu.com/question/41752299/answer/147394973
参考
令人拍案叫绝的Wasserstein GAN的第三部分:Wasserstein距离的优越性质对于Wasserstein距离的解释,十分清晰
注意这里 Π(Pr,Pg) 是 Pr 和 Pg 组合起来的所有可能的联合分布的集合,反过来说, Π(Pr,Pg) 中每一个分布的边缘分布都是 Pr 和 Pg
其实很容易可以想像,真实分布 Pr 是恒定的,但是生成分布 Pg 是变化的,是个变量,在寻找下确界inf的过程,其实就是在优化 Pg ,使得 Pr 和 Pg 之间W距离最小
Earth-Mover距离
http://blog.csdn.net/garfielder007/article/details/50389507