Generative Adversarial Nets:GAN

最新推荐文章于 2023-03-02 09:55:26 发布

枸杞饭团

最新推荐文章于 2023-03-02 09:55:26 发布

阅读量324

点赞数

分类专栏： deep learning

本文链接：https://blog.csdn.net/weixin_40641725/article/details/105631611

版权

deep learning 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

摘要

我们提出了一个通过对抗过程来估计生成模型的新框架，在该框架中，我们同时训练了两个模型：一个捕获数据分布的生成模型G和一个估计样本来自训练的概率的区分模型D数据而不是G。G的训练过程是使D犯错的可能性最大化。该框架对应于minimax两人游戏。在任意函数G和D的空间中，存在唯一的解决方案，其中G恢复训练数据分布，并且D各处都等于1/2。在G和D由多层感知器定义的情况下，整个系统可以通过反向传播进行训练。在训练或样本生成期间，不需要任何马尔可夫链或展开的近似推理网络。实验通过对生成的样本进行定性和定量评估，证明了该框架的潜力。

介绍

深度学习的希望是发现丰富的，层次化的模型，该模型表示人工智能应用中遇到的各种数据的概率分布，例如自然图像，包含语音的音频波形以及自然语言语料库中的符号。到目前为止，深度学习中最显着的成功涉及判别模型，通常是那些将高维，丰富的感官输入映射到班级标签的模型。这些惊人的成功主要是基于反向传播和辍学算法，使用了分段线性单元，它们具有良好的行为梯度。深度生成模型的影响较小，这是由于难以近似最大似然估计和相关策略中出现的许多难处理的概率计算，以及由于难以在生成上下文中利用分段线性单位的优势。我们提出了一种避免这些困难的新的生成模型估计程序。

在提出的对抗网络框架中，生成模型与一个对手相对立：一个判别模型，该模型学习确定样本是来自模型分布还是来自数据分布。生成模型可以被认为类似于一组伪造者，试图生产假币并在未经检测的情况下使用它，而区分模型类似于警察，试图发现伪币。在这场比赛中，竞争促使两支球队都改进自己的方法，直到假冒伪劣品与真品无法区分为止。

该框架可以针对多种模型和优化算法产生特定的训练算法。在本文中，我们探讨了特殊情况，即生成模型通过使随机噪声通过多层感知器来生成样本，而判别模型也是多层感知器。我们将此特殊情况称为对抗网。在这种情况下，我们可以仅使用非常成功的反向传播和dropout算法来训练这两个模型，而仅使用正向传播从生成模型中进行采样。不需要近似推断或马尔可夫链。

对抗网络

当模型都是多层感知器时，对抗建模框架最容易应用。为了了解发生器在数据x上的分布pg，我们在输入噪声变量pz（z）上定义了先验，然后将到数据空间的映射表示为G（z;θg），其中G是由多层感知器表示的微分函数，其中参数θg。我们还定义了第二个多层感知器D（x;θd），它输出一个标量。 D（x）表示x来自数据而不是pg的概率。我们训练D来最大化为G训练样本和样本分配正确标签的可能性。我们同时训练G来最小化log(1-D(G(z)))。换句话说，D和G玩以下具有值函数V（G，D）的两人minimax游戏：
在这里插入图片描述

在实践中，我们必须使用迭代的数值方法来实现游戏。在训练的内部循环中将D优化到完成是计算上的问题，在有限的数据集上会导致过度拟合。取而代之的是，我们在优化D的k个步骤和优化G的一个步骤之间交替进行。只要G的变化足够缓慢，就可以使D保持在其最佳解附近。该过程在算法1中正式提出。
在这里插入图片描述

在实践中，等式1可能无法为G提供足够的梯度来学习。在学习的早期，当G较差时，D可以以高置信度拒绝样本，因为它们明显不同于训练数据。在这种情况下，使log(1-D(G(z)))饱和。与其训练G以使log(1-D(G(z)))最小，我们可以训练G以使log(D(G(z)))最大化。该目标函数导致G和D动力学的相同固定点，但在学习早期就提供了更强的梯度。

在这里插入图片描述

理论结果

我们将在第4.1节中显示，此minimax游戏具有pg = pdata的全局最优值。

在这里插入图片描述

优缺点

与以前的建模框架相比，此新框架具有优点和缺点。缺点主要是没有明确表示pg（x），并且在训练过程中D必须与G很好地同步（特别是，在不更新D的情况下G不能训练太多，以避免出现“ Helvetica场景” （其中G将太多的z值折叠为相同的x值，以至于没有足够的多样性来对pdata进行建模），就像必须在学习步骤之间使Boltzmann机器的负链保持最新一样。优点是不再需要马尔可夫链，仅使用backprop即可获得梯度，在学习过程中无需进行推理，并且可以将多种功能集成到模型中。表2总结了生成对抗网络与其他生成建模方法的比较。前述优点主要是计算上的。对抗性模型还可以从发电机网络中获得一些统计上的优势，而不是直接用数据样本更新发电机网络，而仅用流经鉴别器的梯度进行更新。这意味着输入的组成部分不会直接复制到生成器的参数中。对抗网络的另一个优点是它们可以表现出非常尖锐的分布，甚至是简并的分布，而基于马尔可夫链的方法要求分布有些模糊，以便链能够在模式之间进行混合。
在这里插入图片描述

枸杞饭团

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Generative Adversarial Nets:GAN

摘要我们提出了一个通过对抗过程来估计生成模型的新框架，在该框架中，我们同时训练了两个模型：一个捕获数据分布的生成模型G和一个估计样本来自训练的概率的区分模型D数据而不是G。G的训练过程是使D犯错的可能性最大化。该框架对应于minimax两人游戏。在任意函数G和D的空间中，存在唯一的解决方案，其中G恢复训练数据分布，并且D各处都等于1/2。在G和D由多层感知器定义的情况下，整个系统可以通过反向传播...
复制链接

扫一扫