Generative Adversarial Network 3 WGAN/ EBGAN

前提回顾

JS 散度 Jensen-Shannon Divergence

解决了两个概率分布的相似度,值0-1之间
在这里插入图片描述
但是如果P,Q离得很远,完全没有重叠的时候,KL散度值是没有意义的,JS散度值是个常数,这就意味着这一点梯度为0.

JS divergence is not suitable
  • in most case,PGandPdata are not overlapped
    1.PGandPdata are low-dimension manifold in high-dimension space
    2.even PGandPdata are overlap, if you do not have enough sampling
What is the problem of JS divergence

JS divergence is log2 if two distributions do not overlap
same objective value

一.Wasserstein GAN(WGAN)

Earth Mover’s Distance

在这里插入图片描述

  • there are many possible “moving plans”
  • Using the “moving plan” with the smallest average distance to define the earth mover’s distance

在这里插入图片描述

why earth mover distance

Evaluate wasserstein distance between PGandPdata
在这里插入图片描述
discriminator must be smooth
为了使D 不会变成无穷大或者无穷小

Lipschitz Function
∥ f ( x 1 ) − f ( x 2 ) ∥ ≤ K ∥ x 1 − x 2 ∥ \parallel f(x_1)-f(x_2)\parallel\leq K\parallel x_1-x_2\parallel f(x1)f(x2)Kx1x2

  • 保证output差距不会太大
  • 所以K=1 for “1-Lipschitz”
How to fulfill this constraint
1.WGAN

Improved WGAN (WGAN-GP)

  • D为1-Lipschitz 和 对Dx(x)中所有求x的倒数都小于1
  • 妥协:不能保证所以x倒数都小于1,就保证penalty中的小于1
    在这里插入图片描述

Only give gradient constraint to the region betweenPGand Pdata,because they influence how PG move to Pdata.
在这里插入图片描述

2.spectrum norm

spectral normalization
keep gradient norm smaller than 1 everywhere

The algorithm of WGAN

在这里插入图片描述

二.Energy-based GAN (EBGAN)

在这里插入图片描述

  • discriminator 可以提前训练,只用positive的样本就行
  • do not have to be very negative 因为实际减小是很难的,设定一个阈值就可以
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值