GAN的训练

如何训练生成器:

训练的关键在于,我们希望奖励哪些行为,惩罚哪些行为。这也正是损失函数的作用。
········如果图像通过了鉴别器的检验,我们奖励生成器。
········如果伪造的图像被识破,我们惩罚生成器。

GAN的训练:

我们不希望先用所有的数据训练其中的任何一方,在训练另一方。
我们希望他们能够一起学习,任何一方都不应该超过另一方太多。
如果鉴别器进步来的太快,生成器可能永远也追不上。
如果鉴别器的学习速度太慢,生成器则会因为不断生成质量差较差的数据而受到奖励。

下面3步训练循环是实现这一目标的一种方法。


第一步:向鉴别器展示一个真实的数据样本,告诉它该样本的分类应该是1.0。
——————然后用损失来更新鉴别器。
第二步:向鉴别器展示一个生成器的输出,告诉它该样本的分类应该是0.0。
——————我们只用损失来更新鉴别器。注意,不要更新生成器!!!!
——————我们不希望它因为被鉴别器识破而收到奖励。
第三步:向鉴别器显示一个生成器的输出,告诉生成器结果应该是1.0。
——————我们只用结果的损失来更新生成器,而不更新鉴别器。
——————因为我们不希望因为错误分类而奖励生成器。
这就是大多数GAN训练方案的核心。
``

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值